TokkingHeads, czyli coraz więcej gadających głów. I coraz więcej fałszywych
Statyczne portrety animowane w taki sposób, że wyglądają jak nagrania wideo z głosem to już nie melodia przyszłości, a teraźniejszość. Swoją cegiełkę do tego popularnego trendu dokłada nowa aplikacja Tokkingheads.
Twórcy aplikacji TokkingHeads, firma Rosebud.Ai, dosyć odważnie twierdzą, że chcą „destabilizować sposób tworzenia mediów". Ich program wykorzystuje sztuczną inteligencję, aby zamienić dowolny nieruchomy obraz w poruszającego się, mówiącego awatara.
Jak to działa? Wystarczy wgrać zdjęcie portretowe do aplikacji i wybrać sposób animacji.
Możemy nagrać dźwięk, wpisać tekst ręcznie, a nawet wgrać wideo, które będzie bazą do animacji. Możemy także wykorzystać już gotowe głosy. Program daje możliwość wyboru płci, rodzaju oraz akcentu podkładanego głosu. Usługa nie jest ograniczona do zdjęć prawdziwych ludzi i może animować nieruchome obrazy rysunków lub renderów.
TokkingHeads jest darmowa, ale w podstawowej wersji są reklamy, a jakość generowanych obrazów jest słaba i mają one znak wodny. W wersji płatnej otrzymujemy dostęp do obrazów wysokiej jakości.
TokkingHeads to kolejny produkt firmy Rosebud.AI, która oferuje także aplikację Generative Photos. Dzięki niej można błyskawicznie zmienić twarze na zdjęciach, kolor włosów, wiek, wyraz twarzy i wiele więcej. Jak podają twórcy, usługa ma być przydatna np. przy edycji stockowych zdjęć wykorzystywanych w sklepach internetowych czy innych projektach, aby odróżnić się od konkurencji.
TokkingHeads nie jest pierwszą taką aplikacją. To dopiero początek.
Kilka dni temu w mediach społecznościowych królowały animacje w stylu Deep Nostalgia, tworzone za pomocą serwisu MyHeritage. Wykorzystuje on sztuczną inteligencję, aby automatycznie animować historyczne portrety i dodać trochę życia naszym przodkom.
Z kolei twórcy aplikacji Hour One opisują się jako „firma zajmującą się transformacją wideo", która chce zastąpić kamery kodem. Ich najnowsze dzieło daje możliwość stworzenia cyfrowego klona samego siebie, który może imitować nagrania bez kamery.
Ostatnio na Tiktoku słynny zaczął być profil deeptomcruise, który publikuje nagrania, na których autor udaje Toma Cruise'a dzięki technologii deepfake. Efekty są naprawdę dobre, a jeśli ktoś nie wczytuje się w opisy, to może uwierzyć, że to konto prawdziwego aktora.
Efekty aplikacji TokkingHeads zazwyczaj nie są tak dobre, ale też szybkość i prostota animacji jest imponująca. Animacje są w miarę naturalne, chociaż widać, że nie jest to prawdziwe nagranie.
Czy AI zabierze pracę fotografom i twórcom wideo?
Czuć, że to dopiero początki tej technologii, za kilka lat zapewne nie będziemy w stanie rozpoznać animowanych zdjęć od prawdziwych nagrań. O wielu niebezpieczeństwach oraz aspektach prawnych technologii deepfake pisano już nie raz. Mnie bardzo ciekawi, czy algorytmy zabiorą pracę twórcom treści foto i wideo. Myślę, że część obrazów może zostać zastąpiona sztuczną inteligencją, a z pewnością algorytmy zaczną odgrywać ważną rolę w treściach tworzonych do Internetu. Będą przydatne przy prostych zadaniach czy niskobudżetowych kampaniach, kiedy nie ma budżetu na normalną sesję.
Mam wrażenie, że algorytmy jednak nigdy nie zastąpią wysokiej jakości treści, do których potrzeba doświadczenia, własnego stylu, wyczucia czy niezwykłych lokalizacji. Sytuacja może być podobna do roli botów na infoliniach. Są przydatne, aby pomóc w bardzo prostych sprawach, ale jeśli tylko wychodzili poza pewne ramy, to i tak potrzebny jest człowiek.