Sprawdź, jak wyglądasz oczami sztucznej inteligencji. W Lensa AI wygenerowałem grafikę i wygląda zupełnie jak ja
Awatary w mediach społecznościowych można już generować poprzez sztuczną inteligencję. Sprawdziłem to rozwiązanie, po czym otrzymałem 100 zdjęć przedstawiających… mnie. Efekt jest wręcz niepokojąco dobry.
Sztuczna inteligencja robi się coraz lepsza w malowaniu obrazów. Dochodzi do tego, że grafiki tworzone przez algorytmy wygrywają konkursy graficzne, a jury nie ma pojęcia, że praca jest dziełem sztucznej inteligencji. Więcej o programach do generowania obrazów przeczytacie w moim tekście, a Kuba Wątor w swoim materiale zastanawiał się, czy AI właśnie zaczyna pożerać artystów.
Grafiki generowane przez AI już znamy, ale awatary prawdziwych ludzi? To nowość
Właściwie każdy z nas potrzebuje awatara do posługiwania się nim w mediach społecznościowych - na Facebooku, Twitterze, czy Instagramie. Generowanie awatarów prawdziwych ludzi to nowa umiejętność sztucznej inteligencji Prisma AI. Twórcy technologii dodali taką funkcję do swojej aplikacji Lensa AI. Generowanie awatarów jest obecnie dostępne tylko na iPhone’ach.
Jak to wszystko działa? W pierwszym kroku musimy nauczyć algorytm, jak właściwie wyglądamy. W tym celu aplikacja prosi nas o przesłanie od 10 do 20 zdjęć przedstawiających nas samych. Aplikacja informuje o tym, co jest dozwolone, a co nie. Przykładowo, nie można wrzucać zdjęć dzieci ani fotek z nagością. Do tego algorytm na razie nie rozumie zdjęć w okularach słonecznych i nie działa optymalnie kiedy na zdjęciu jest więcej niż jedna osoba.
Po przesłaniu zdjęć (i zapłaceniu, o czym za chwilę), musimy jeszcze podać płeć, a następnie algorytm analizuje i tworzy nasz nowy awatar. Trwa to dość długo, bo kilkadziesiąt minut. Efektem jest paczka 50, 100 lub nawet 200 różnych ujęć stworzonych od zera przez sztuczną inteligencję.
To naprawdę działa. Jakieś 70 proc. wygenerowanych awatarów naprawdę wygląda jak ja
Na 100 wygenerowanych awatarach minimum 70 wygląda niepokojąco podobnie do mnie. W paczce znajduje się po kilka wariantów grafik stworzonych w 10 stylach graficznych, od hiperrealistycznych "zdjęć", poprzez stylizowane wizualizacje (np. w skafandrze kosmicznym czy w mundurze), aż po całkowicie rysunkowe, graficzne przedstawienie rodem z anime.
Co ważne, nie patrzymy na zwykłe filtry. System wygenerował moją twarz pod najróżniejszymi kątami, w tym również pod takimi, których nie miał w bazowych zdjęciach. Zaskoczył mnie też dobór fryzur, których system też nie miał, a które wyglądają tak, jakby rzeczywiście mogły być moimi włosami.
Spośród stu awatarów na kilkunastu widać ewidentne błędy sztucznej inteligencji. Na jednym ze "zdjęć" awatar podpiera twarz ręką, przy czym dłoń zlewa się z twarzą. Na innych widać dziwne deformacje, które świadczą o tym, że system niepoprawnie rozpoznał oczy bądź inne elementy twarzy. Kilkanaście kolejnych prac to z kolei całkowicie abstrakcyjne dzieła, na których jestem albo nierozpoznawalny, albo wręcz niewidoczny. Ogólna skuteczność algorytmu jest jednak niepokojąco wysoka.
Awatary generowane przez AI mogą stać się nowym trendem, ale warto podchodzić do nich na chłodno
Możliwość wygenerowania swoich awatarów przez sztuczną inteligencję jest czymś pociągającym, ale wiążą się z nią dwie kontrowersyjne kwestie.
Pierwszą jest prywatność. Pamiętajcie, że algorytm w pierwszej fazie trzeba nakarmić własnymi fotkami, przesyłając 10-20 prawdziwych fotografii. Te zdjęcia będą analizowane i przetwarzane przez algorytmy, których działania tak naprawdę nie znamy. Twórcy mówią wprost: twoje fotki posłużą nam do rozwijania i udoskonalania naszej sztucznej inteligencji. Jednocześnie zapewniają, że zdjęcia znikają z serwerów po 24 godzinach, podobnie jak awatary, ale trzeba liczyć się z możliwością, że te fotki mogą wyciec. Warto trzy razy przemyśleć, czy zdjęcia przesłane do aplikacji nie są kompromitujące.
Druga kwestia to cena, bo generowanie awatarów jest funkcją płatną
Wycena awatarów w aplikacji Lensa AI wygląda następująco:
- za 17,99 zł mamy 50 grafik (5 wariacji w 10 stylach),
- za 29,99 zł mamy 100 grafik (10 wariacji w 10 stylach),
- za 39,99 zł mamy 50 grafik (20 wariacji w 10 stylach).
Co więcej, zakup awatarów to dodatkowa płatność ponad abonament konieczny do działania podstawowej wersji aplikacji. Lensa AI jest de facto bardzo rozbudowaną apką do edycji zdjęć i filmów, a korzystanie z niej kosztuje 139,99 zł rocznie, przy czym jest tutaj tygodniowy trial za darmo. Po jego wykorzystaniu generowanie awatarów zrobi się dość kosztowne, bo trzeba będzie zapłacić abonament za aplikację oraz do tego wykupić opcję utworzenia nowej paczki awatarów.
Płacenie za możliwość generowania grafik wydaje się docelowym modelem działania algorytmów sztucznej inteligencji
Ten sam mechanizm znamy już z popularnych kreatorów Midjourney i Dall-e 2.0, które są dostępne publicznie. Oba pozwalają na pewną niewielką pulę grafik możliwych do wygenerowania, a jeśli chcemy więcej, trzeba otworzyć portfel.
Jest to w pełni zrozumiałe, bo przecież sztuczna inteligencja nie jest projektem charytatywnym. Za każdym skutecznym algorytmem stoi zespół, który rozwijał - niekiedy całymi latami - swój projekt, więc nic dziwnego, że w pewnym momencie przychodzi czas komercjalizacji działającego dzieła. Dochodzi też aspekt mocy obliczeniowej. Pamiętajmy, że algorytmy działają na serwerach prowadzonych przez twórców sztucznej inteligencji, a za moc obliczeniową po prostu trzeba zapłacić.
Dlaczego taki system nie może działać bezpośrednio na smartfonie lub komputerze użytkownika? Powody są dwa. Pierwszym jest fakt, że nasze awatary to tylko część wielkiego systemu sztucznej inteligencji, który tworząc nowe dzieła, stale się rozwija. Jeśli algorytmy działałyby na urządzeniach użytkowników, rozwój systemu mógłby znacznie zwolnić. Jedna centrala baza pozwala z jednej strony na szybsze działanie systemu, a z drugiej, na jego ciągłe udoskonalanie.
Podejrzewam, że kolejnym powodem, dla którego algorytmy sztucznej inteligencji nie działają na urządzeniach końcowych użytkowników, jest po prostu chęć ochrony własności intelektualnej. Kiedy wszystko działa na serwerach twórców, nie mamy żadnego wglądu w algorytmy. Potencjalnie konkurenci nie są w stanie zbudować podobnego systemu w krótkim czasie. A widać wyraźnie, że segment AI to wielka rzecz, która będzie napędzać technologie w nadchodzących latach. Nic dziwnego, że żadna firma nie chce dzielić się swoimi dokonaniami z kimś innym.