REKLAMA

Beckham przemówił w dziewięciu językach dzięki syntezie wizualnej. To nieco przerażająca przyszłość marketingu

Synthesia rozwija oprogramowanie, które pozwala tworzyć filmy, w tym promocyjne, za pomocą sztucznej inteligencji z minimalnym udziałem człowieka. Podczas edycji pierwotnego materiału można zmieniać głos, gesty, język, którym mówi bohater, a nawet scenariusz.

Beckham przemówił w dziewięciu językach dzięki syntezie wizualnej
REKLAMA
REKLAMA

Londyńska firma Synthesia zyskała rozgłos dzięki swojej niedawnej pracy w kampanii charytatywnej z udziałem Davida Beckhama „Malaria No More”. Podczas realizacji projektu wykorzystano oprogramowanie startupu do animacji twarzy byłego piłkarza, aby umożliwić mu płynne mówienie w dziewięciu różnych językach, którymi w rzeczywistości się nie posługuje.

Kolejny filmik ujawnia szczegóły realizacji projektu.

Jak podaje prolificlondon.co.uk, ENACT, platforma chmurowa stworzona przez Synthesię umożliwia swoim użytkownikom automatyczne generowanie spersonalizowanych i interaktywnych treści wideo w szybki (nawet w 48 godzin) i tani sposób.

Aby osiągnąć w pełni fotorealistyczną syntezę wideo człowieka, inżynierowie firmy musieli opracować nowe technologie w dziedzinie wizji komputerowej, grafiki i deep learningu. Rozwiązanie techniczne podobne do tego, które wykorzystywane jest przy tworzeniu tradycyjnych efektów wizualnych, natomiast oprogramowanie firmy używa szeregu technologii głębokiego uczenia, aby proces był całkowicie zautomatyzowany.

Ostatnio londyński startup otrzymał 3,1 mln dol. inwestycji na rozwój w zakresie tworzenia przekazów wideo za pomocą AI.

Inwestorem głównym został Mark Cuban (LDV Capital), do którego dołączyli MMC Ventures, Seedcamp, VAS Ventures, Taavet Hinrikus (współzałożyciel TransferWise), Tiny VC i Nigel Morris.

Usługi technologiczne Synthesia mogą być szczególnie przydatne w agencjach reklamowych i firmach marketingowych, które pragną dotrzeć do wybranych grup kulturowych, stworzyć u potencjalnego klienta poczucie, że przekaz został przygotowany specjalnie dla niego. Przy tym znacznie oszczędzą czas i pieniądze.

Czy nam się to podoba, czy nie, konsumenci oczekują dziś komunikacji w postaci materiałów wideo, które są do nich dostosowane. Tradycyjne reklamy rzadko odwołują do uczuć i emocji grupy docelowej, wyglądają tak samo dla wszystkich, a przecież nawet w jednym kraju mogą mieszkać zupełnie różne narodowości.

Przykładem dostosowania filmu promocyjnego do przedstawicieli określonej grupy docelowej może być reklama Plusa z ofertą dla Ukraińców. Firma stworzyła przekaz w języku ukraińskim na temat bliski grupie docelowej, czyli zarobków w Polsce. Innymi słowy, odbiorcy chętniej oglądają przekaz, w którym bohater mówi w ich ojczystym języku na tematy im zrozumiałe i bliskie, jednak tworzenie osobnego przekazu dla każdej narodowości w grupie docelowej może okazać się zbyt drogie.

Wirtualni prezenterzy telewizyjni w Chinach i Rosji

Startup Synthesia nie jest jedynym, który rozwija się w kierunku tworzenia filmów ze sztuczną inteligencją. W 2018 r. agencja prasowa Xinhua wraz z chińską firmą internetową Sogou zaprezentowały pierwszego na świecie cyfrowego prezentera telewizyjnego z SI.

Według twórców sztuczna inteligencja jest w stanie analizować mimikę człowieka, sposób mówienia, gestykulacji i jego głos. Aby stworzyć film w programie, wystarczy załadować wideo z żywym prezenterem i niezbędny tekst. Hologram przedstawia wiadomości, kopiując cechy „oryginalnego” prezentera.

W kwietniu 2019 r. Sberbank (największy bank Rosji) przedstawił cyfrowego prezentera telewizyjnego. Oprogramowanie dostało nazwę „Elena” i działa na tej samej zasadzie, co opisany wyżej prezenter z Chin - po załadowaniu wideo i tekstu program generuje nowy film. Wirtualna Elena kopiuje gesty, głos i sposób mówienia oryginalnej wersji siebie. „Elenę” planują wykorzystać przy tworzeniu reklamy, materiałów edukacyjnych, a również w urządzeniach AGD.

Wśród głównych zalet wykorzystania prezenterów wirtualnych, jak podkreślają autorzy pomysłu, jest możliwość emitowania wiadomości bez przerwy 24 godziny na dobę. Wirtualny prezenter nigdy się przecież nie męczy. Ponadto nie popełnia błędów, co znaczy, że tworzenie odcinku wiadomości zajmie znacznie mniej czasu.

Wśród klientów firmy już są BBC, Accenture i Buzzfeed.

Londyński startup wyszedł z ukrycia w listopadzie 2018 r., emitując swoje pierwsze publiczne demo w BBC — prezenter wiadomości, Matthew Amroliwala, mówił w trzech różnych językach. Wśród klientów startupu są już takie globalne marki jak Accenture, McCann Worldgroup, Dallas Mavericks i Axiata Group.

Czy podobna innowacja może zostać wykorzystana do tworzenia fałszywych newsów i dezinformacji?

Synthesia deklaruje, że ma ustalone twarde wytyczne etyczne i dba o to, żeby wszystkie stworzone treści były prawdziwe. Nie oferuje oprogramowania, które może być pobrane i używane bez kontroli przez kogokolwiek. Materiał wideo przechodzi przez proces kontroli wewnętrznej.

REKLAMA

Twórcy technologii zobowiązują się również, że:

  • nigdy nie będą wykorzystywać czyjegoś wizerunku bez jego wyraźnej zgody. Obejmuje to również filmiki z udziałem polityków i celebrytów — nawet do celów satyrycznych.
  • Synthesia będzie nadal aktywnie współpracować z organizacjami medialnymi, rządami i instytucjami badawczymi w celu opracowania najlepszych praktyk i edukowania w zakresie technologii syntezy wideo, aby zmniejszyć potencjalne negatywne skutki od ich stosowania.
REKLAMA
Najnowsze
Aktualizacja: tydzień temu
REKLAMA
REKLAMA
REKLAMA