Oprogramowanie  / Artykuł

Jedno zdjęcie wystarczy, by stworzyć realistyczne wideo. Oto nowa technologia Samsunga

Wyobraź sobie, że ktoś robi ci jedno zdjęcie, a na jego podstawie tworzy ultrarealistyczną animację, na której mówisz coś zupełnie wbrew sobie. To nie wizja przyszłości rodem z Black Mirror, tylko nowa technologia Samsunga.

Jestem absolutnie przerażony widząc rozwój - w tym szybkość rozwoju - AI w zakresie generowania i animowania ludzkich twarzy. Tylko spójrzcie na poniższe zdjęcia.

Co łączy te portrety? Ano to, że żadna z przedstawionych na nich osób nie istnieje. Są to przykłady działania uczenia maszynowego, które można obejrzeć na stronie thispersondoesnotexist.com. Każde odświeżenie generuje nową twarz zbudowaną przez algorytmy na bazie olbrzymiej liczby przykładów, które wcześniej zostały automatycznie przeanalizowne.

Generowanie twarzy nie jest nawet w ułamku tak przerażające, jak generowanie ultrarealistycznej animacji.

Niedawno Matylda pisała o nowej reklamie zrealizowanej z udziałem Davida Beckhama, w której były piłkarz mówi w dziewięciu językach. Osiągnięto to poprzez bardzo realistyczną animację twarzy, wspieraną przez algorymty uczenia maszynowego.

To również nie jest jeszcze niczym niezwykłym w 2019 roku. Prawdziwie przerażająco wygląda nowa technologia Samsunga.

Jedno zdjęcie wystarczy, by stworzyć realistyczne wideo.

Nowa technologia opracowana przez rosyjski oddział Samsung AI Center brzmi jak pomysł wyrwany z science fiction. Algorytmy AI na podstawie jednego zdjęcia są w stanie animować twarz i tworzyć symulację pełnego modelu 3D z bogatą mimiką.

Technologia nie jest idealna, ale już teraz działa na tyle sprawnie, że jest w stanie animować nie tylko zdjęcia, ale nawet obrazy. Dokładność animacji poprawia się wraz ze wzrostem liczby statycznych zdjęć, na bazie których będzie działał algorytm.

Patrzę na to z przerażeniem.

Ktoś powie: hej, przecież taka technologia otworzy nowy etap w grach wideo, czy w kinie. Możliwe, że tak się stanie. Jest jednak druga strona medalu, czyli potencjał w generowaniu fake-newsów. Jeżeli w tak prosty sposób można stworzyć tak bardzo realistyczną animację, to jak właściwie mamy się bronić przed dezinformacją?

W usta polityków będzie można włożyć dowolne słowa. Z kolei polityk, który palnął publicznie głupotę, będzie mógł zasłaniać się manipulacją przeprowadzoną przez wrogi obóz. Daje to pole do niespotykanej wcześniej łatwości tworzenia oszustw i nadużyć. Nietrudno wyobrazić sobie kompletny chaos informacyjny, jaki może wywołać taka technologia.

O ile w przypadku animacji 3D dość łatwo wpadamy w dolinę niesamowitości (nieprzyjemną świadomość, że oglądamy sztuczną twarz, która jest zbytnio podobna do prawdziwej), to w przypadku animacji generowanej przez algorytmy AI takiego poczucia nie ma.

Na podstawie zdjęć pokazanych na początku tego tekstu nie da się stwierdzić, że są nieprawdziwe. Czasami zdarzają się rażące błędy w generowaniu twarzy, ale na ogół system działa perfekcyjnie. Jeśli tak samo będą działać filmy, to mamy przechlapane.

Kwestie etyczne w takich projektach będą przedmiotem coraz częstszych dyskusji.

Już teraz firmy zajmujące się rozwojem AI tworzą oświadczenia zapewniające, że animacje powstają bez złych zamiarów. Nie sposób jednak uchronić się przed wszelkiej maści trollami, którzy jakiekolwiek zasady etyki mają w głębokim poważaniu.

Jestem przekonany, że stworzenie aplikacji mobilnej generującej tak realistyczne animacje jest całkowicie możliwe, a może nawet jest tylko kwestią czasu. Wystarczy nawet spojrzeć na dalece bardziej prymitywne filtry AR w Snapchacie, by przekonać się, że przerabianie twarzy na żywo działa już dziś i ma się bardzo  dobrze.

Nowa technologia jest fascynująca z naukowego i estetycznego punktu widzenia, ale jako odbiorca mediów widzę w niej ogromne niebezpieczeństwo. A pamiętajmy, że jesteśmy dopiero u progu rozwoju takich algorytmów. Te już stworzone doskonalą się same wraz z każdym nowym stworzonym projektem. Z kolei te przyszłe będą jeszcze dokładniejsze.

Kto wie, może za kilka lat zatęsknimy za czasami, kiedy szczytem nadużycia było wygumkowanie serduszka WOŚP z kurtki rozmówcy.

przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst