Spotify kupił technologię, dzięki której Val Kilmer odzyskał głos. Nie wiemy do czego ją wykorzysta, ale domyślamy się
Spotify wybrał się na zakupy. Jego najnowszy nabytek to firma Sonantic, dzięki której bohater grany przez Vala Kilmera, czyli Tom "Iceman" Kazansky, mógł przemówić w filmie Top Gun: Maverick. Nie zdziwię się, jeśli na platformie, która nadal kojarzy się głównie z muzyką, pojawią się teraz podcasty i audiobooki generowane z użyciem technologii Deep Fake.
Val Kilmer stracił głos w 2014 roku po kuracji raka krtani, co położyło się cieniem na jego dalszej karierze. Mimo to aktor pojawił się w filmie Top Gun: Maverick obok Toma Cruise'a, a portretowany przez niego ponownie po latach Tom "Iceman" Kazansky przemówił z ekranu. Zawdzięczamy to technologii typu Deep Fake oraz algorytmom generowania mowy wykorzystującym uczenie maszynowe i sztuczną inteligencję.
Czytaj też:
Za przywrócenie aktorowi głosu na potrzeby filmu odpowiada firma Sontantic. Dzięki opracowanej przez nią technologii, Tom "Iceman" Kazansky mógł w Top Gun: Maverick przemówić, chociaż Val Kilmer nie był w stanie nagrać swoich kwestii samodzielnie. Teraz zaś przedsiębiorstwo, które mu pomogło, przejął największy serwis do streamingu muzyki materiałów audio, czyli Spotify.
Seriws nie zdradza, do czego docelowo będzie wykorzystywać algorytmy Sontantic. W komunikacie znajdują się tylko ogólniki o "poprawianiu doświadczenia użytkowników" oraz rozwiązaniach typu text-to-speech do odczytywania rekomendacji podczas jazdy. Patrząc jednak na ostatnie ruchy Spotify, można wykoncypować, że chodzi o coś więcej, czyli tę drugą gałęź biznesu obok muzyki.
Już teraz w ofercie Spotify obok utworów można znaleźć liczne audycje oraz słuchowiska (co upodabnia serwis do... radia). Firma wydaje grube pieniądze na pozyskiwanie treści takich jak podcasty i audiobooki, a w przeszłości mierzyła się nawet z kryzysem wizerunkowym ze względu na to, co konkretnie znajduje się w jej bazie. Nie zraziła się jednak i dalej rozwija katalog.
Nie zdziwię się, jeśli do bazy Spotify zawitają w przyszłości podcasty i audiobooki generowane przez algorytmy.
Problem z produkcją podcastów i audiobooków jest jednak taki, że trzeba zatrudnić kogoś, kto użyczy swego głosu, a potem posadzić go w studiu i czekać, aż nagra swoje kwestie i dopiero wtedy można brać się za montaż. W dodatku właściciele znanych i rozpoznawalnych głosów są rozchwytywani i mogą nagrywać tylko jedną pozycję naraz i staje się to takim wąskim gardłem całego procesu.
Deep Fake symulujący głos eliminuje te wszystkie problemy logistyczne. Już teraz technologia pozwala nam na stworzenie wiarygodnie brzmiącego podcastu z głosem jakiegoś twórcy lub audiobooka czytanego przez znanego lektora (lub np. autora danej pozycji). Jeśli miałbym strzelać, to właśnie w celu zmechanizowania produkcji treści Spotify nabył Sonantic.
Jeśli zaś chodzi o technologię Deep Fake, to dopiero odkrywamy jej potencjał oraz uświadamiamy sobie zagrożenia, jakie ona przynosi. Z jednej strony to właśnie dzięki niej mogli powrócić po latach m.in. bohaterowie pierwszej trylogii Gwiezdnych wojen, a aplikacje pozwalają nam się zmienić w np. śpiewającego Elona Muska, ale te same algorytmy mogą produkować... fałszywych dziennikarzy wspierających Rosję.