Kilka minut i powstaje nowy hit Queenu, Beyonce czy Podsiadły. Tak sztuczna muzyka niszczy artystów
Algorytmy sztucznej inteligencji są w stanie w kilkadziesiąt sekund skomponować i odegrać dokładnie taką piosenkę, o jaką poprosi użytkownik. Czy artysta nadal ma głos?
Kiedy po raz pierwszy w muzyce zaczęto używać syntezatorów i dźwięków generowanych przez elektryczne i elektroniczne instrumenty, wielu koneserów tej sztuki uważało te techniki za bluźnierstwo. Wszak melodia i rytm powinny powstawać na skutek fizycznych interakcji między fizycznymi obiektami - między smyczkiem a struną, pałką a naciągiem, powietrzem a strunami głosowymi - żeby to była prawdziwa muzyka, nieprawdaż?
Rozmaici artyści, którzy w niezwykle kreatywny sposób wykorzystali nowego rodzaju instrumenty i narzędzia, uciszyli większość sceptyków. Publiczność zaakceptowała elektroniczne instrumenty, a po czasie zaakceptowała również i muzykę w całości generowaną przy pomocy narzędzi komputerowych. Udało jej się bowiem w końcu zrozumieć, że za tymi nowymi narzędziami niezmiennie stoją artyści. Piosenki i utwory stworzone przy pomocy elektronicznych i elektrycznych narzędzi mogą mieć w sobie tyle samo duszy i artyzmu, co te odegrane na instrumentach analogowych.
Ostatnie miesiące zrodziły jednak zupełnie nowe pytanie. Czy za muzyką musi w ogóle stać człowiek? Przełom w pracach nad cyfrowymi Dużymi Modelami Językowymi przyczynił się do błyskawicznej popularyzacji tak zwanej generatywnej sztucznej inteligencji. Ta, nakarmiona terabajtami danych wzorcowych, potrafi generować zupełnie nowe treści. Tekst, grafikę, muzykę, kod programistyczny i więcej.
Przeczytaj więcej:
Niewiele wakacyjnych hitów pop odniosło taki sukces, co rap Eminema o kotach. Problem w tym, że Eminem nie miał z nim nic wspólnego.
Niektórzy z czytelników zapewne kojarzą viralowe wideo z Eminemem - znanym raperem - nawijającym o kotach. Niestety nie możemy załączyć teledysku do artykułu, bo wytwórnia muzyczna opiekująca się Eminemem dość skutecznie pozbyła się tego nagrania z legalne działających usług streamingowych. Nie wszyscy jednak wiedzą, że nagranie to nie powstało przy udziale artysty. Tekst skomponował ChatGPT, czatbot od firmy OpenAI. Wykonaniem numeru zajął się ElevenLabs Prime AI i osoba, która to narzędzie obsługiwała. Trudno się dziwić osobom, które się nie poznały na podróbce - brzmi bardzo wiarygodnie.
To nie jedyny viral - w Sieci bardzo łatwo znaleźć inne hity, które powstały wyłącznie w wyobraźni centrum danych któregoś z informatycznych gigantów. Załączona wyżej piosenka brzmi, jakby za mikrofonem stał Jay-Z, a naśladownictwo jest tak wierne, że odróżnienie go od oryginału wydaje się niemożliwym nawet dla największego fana. A należy dodać, że powyższe nagranie to nie efekt wielu godzin prac inżynierów dźwięku. JukeBox, Google MusicLM czy Dance Diffusion skomponują aranż muzyczny na podstawie wskazówek i deklaracji użytkownika. Prime AI sklonuje brzmienie dowolnego głosu. Tekst napisze Bing Czat czy ChatGPT. Dla osoby oswojonej z interfejsem takich narzędzi stworzenie nowego singla Queen, Beatlesów czy Dawida Podsiadło może się zamknąć w kilkudziesięciu minutach pracy. A nawet szybciej, jak szczęście pozwoli.
Studio nagraniowe, artyści i personel - to duże wydatki.
Wiele zależy od jakości samego narzędzia. Eksplozja popularności narzędzi związanych z generatywną SI nie oznacza, że ta część informatyki osiągnęła jakąkolwiek dojrzałość. Eksperci wręcz są zgodnej opinii, że giganci branży nieco przedwcześnie pokazali światu tę technologię z uwagi na jej duże niedoskonałości. W powietrzu wiszą jednak miliardy dolarów wpływów i mało kto słucha ostrzeżeń ekspertów.
Dla przykładu, firma Futuri zamieniła model językowy GPT-3 od OpenAI w radiowego DJ-a. Usługa RadioGPT została już wdrożona przez pierwsze stacje radiowe. Usługa ta wykorzystuje mechanizm TopicPulse do skanowania Twittera, Instagrama i tysiące innych źródeł, by rozpoznać istotne dla odbiorców tematy i dominujące nastroje - następnie komponuje całą radiową ramówkę, z wypowiedziami dla prowadzącego i piosenkami (z archiwum) do puszczenia. Przy czym usługą dodatkową jest realistyczna synteza mowy, jakby stacja radiowa chciała przyoszczędzić też na samym DJ-u.
RadioGPT nie generuje nowych piosenek, ale stanowi dobry przykład potężnego narzędzia wykorzysującego generatywną SI i które już na rynku funkcjonuje. Z generatorami utworów muzycznych sprawa wygląda nieco inaczej - dane, na których szkolone były niektóre z modeli obejmowały utwory objęte prawami autorskimi. Operatorzy niektórych z tych usług na razie więc nie chcą jeszcze oferować ich do użytku komercyjnego, bowiem nadal nie rozgryźli wyzwania związanego z prawem do tych utworów. Część narzędzi, w tym niektóre z wymienionych wyżej, celowo jest ogłupianych, by uniknąć skandali i niepotrzebnych pytań, przez co wygenerowane przez nie utwory trudno nazwać potencjalnymi hitami. Niektóre z narzędzi są jednak upiornie dobre.
Z narzędzi, które może przetestować każdy z czytelników Spider’s Web i które z pewnością trudno nazwać niewypałami jest wspomniany wyżej Google MusicLM. Model ten został wyszkolony na 280 tys. godzin muzyki, a jakość jego tworów i prostota użytku jest aż niepokojąca. Bluesowa piosenka z kobiecą wokalistką, smutna, wzruszające solo na saksofonie. Albo eurodance lat 1990 z twardym beatem i melodyjką na organach. I już. Im precyzyjniejsze polecenie, tym piosenka będzie zgodniejsza z intencjami osoby piszącej polecenie. MusicLM rozumie wszelakie koncepcje, jakie tylko mogą przyjść na myśl. Imponujące, bez wątpienia. Trudno jednak nie czuć podświadomie niepokoju - ale czy to nie jest tak, że znowu starzy ludzie boją się pożytecznych zmian?
Trudno o nowocześniejszą usługę muzyczną niż Spotify. To jeden z liderów rynku streamingowego, choć oczywiście nie samotny - ma mocną konkurencję w postaci chociażby Apple Music czy YouTube Music. Spotify jednak w szczególny sposób angażuje się w prace nad sztuczną inteligencją, a już usługa ta w dużej mierze zarządzana jest przez SI, dynamicznie generując użytkownikom coraz to nowsze playlisty, starając się idealnie dopasować do gustu każdego z nich. Spotify wielokrotnie przez to był oskarżany o zamykanie użytkowników w tak zwanych bańkach zainteresowań, przez co ci mniej chętnie eksplorują inne brzmienia. Spotify pracuje też nad technologią syntetycznych DJ-ów. Ale nawet ten gigant widzi pewien problem z syntezą całych piosenek.
- My i nasi partnerzy [wytwórnie muzyczne - przyp. red.] próbujemy znaleźć wspólne stanowisko, w którym innowacyjność nie jest blokowana, ale też w którym ta nie szkodzi twórcom, którzy zaufali naszej platformie - jak bardzo ostrożnie wypowiedział się na łamach podcastu For The Record prezes Spotify, Daniel Ek. Słuchając rozmowy można odnieść wrażenie, że słowa pana Eka zostały starannie przygotowane przez zaplecze PR-owe, by nie rozzłościć wytwórni muzycznych - wspomnianych partnerów. I choć Ek w rozmowie próbował przedstawiać też i korzyści płynące z tej technologii, wprost wskazał problem praw autorskich jako palący i na dziś nierozwiązywalny. Trudno bowiem rozmawiać o wartości artystycznej generatywnej SI, skoro póki co jej twórczość ociera się o plagiat.
Syntetyczna muzyka - plagiat czy inspiracja?
W ogromnym uproszczeniu, generatywna SI ma wiele wspólnego ze statystyką. Algorytmy przewidują jakie dane powinny być wygenerowane obok tych wstępnych. Na podstawie terabajtów danych wzorcowych budowany jest model, za sprawą którego maszyna przewiduje jakie słowo powinno się znaleźć obok tego już wygenerowanego. Jaka grupa pikseli w sąsiedztwie tej już wyrenderowanej. Czy jak widmo fali dźwiękowej powinno być rozszerzone. Choć iluzja jest całkiem przekonująca, generatywna SI nie rozumie tego, co tworzy. Skomponowane wiersze nie wynikają z jej wrażliwości, a za wygenerowanymi melodiami nie stoi żadna emocja. To nowa wariacja tego, co już było.
To oczywiście rodzi pytanie czy przypadkiem nie można tego samego powiedzieć o muzyce wygenerowanej przez artystę-człowieka. Czy jeżeli ktoś wychował się na klasyce muzyki rockowej i mając w sercu taką inspirację napisze nową rockową piosenkę - to przecież trudno to nazwać plagiatem. To prawdopodobnie proces twórczy znacznej części muzyków, natchniętych przez obcowanie z tą sztuką i chcących coś dodać w jej ramach od siebie.
Trudno więc autorytatywnie krytykować muzykę generowaną - jeśli cieszy odbiorców, zapewnia im rozrywkę i zaspokaja ich wrażliwość, to znaczy, że swoją rolę spełnia. Potencjalna reakcja odbiorców jest jednak na dziś trudna do zmierzenia. Znaczy się, bez żadnej wątpliwości wytwórnie muzyczne już dawno przeprowadziły serię badań fokusowych, chcąc lepiej zrozumieć swoją potencjalną przyszłość. Wynikami badań się jednak nie dzielą - a jednak, mimo wszystko, generowana muzyka jeszcze nie odcisnęła widocznego piętna na popkulturze. Jest na to zbyt wcześnie, a popularność wspomnianych wcześniej viralowych nagrań wynika z niezwykłości i efektu nowości. Czas pokaże, czy muzyka generowana przez algorytmy znajdzie realne uznanie wśród odbiorców.
Artyści i algorytmy na równych prawach i zasadach. Czy to w ogóle możliwe?
Jeżeli jednak uznać wytwory generatywnej sztucznej inteligencji za pełnoprawne utwory, to oznacza to, że podlegają takim samym prawom i zasadom jak autorskie piosenki, covery, remiksy i inne dzieła mające wystarczający zestaw unikalnych cech, by podlegać prawu autorskiemu. To oznacza, że zarówno podlegać powinny ochronie - ale też nie wolno dopuścić do sytuacji, w których kompozytor i wykonawca pasożytują na cudzej twórczości i przypisują sobie cudze dokonania artystyczne. Czy sztuczny Eminem rapujący o kocie to utwór żerujący na cudzej pracy?
- Są w tym układzie trzy byty. Utwór (kompozycja), wykonanie utworu (nagranie) i prawa do wizerunku (dobra osobiste). ZAiKS zajmuje się tylko pierwszą kategorią - prawami autorskimi. Prawa do wizerunku czeka zapewne spora rewolucja, bo technologia umożliwia dziś ich łatwe naruszanie, co zresztą jest gorąco dyskutowane przy okazji trwającego teraz strajku związku aktorów - jak mówi w rozmowie ze Spider’s Web Jerzy Łabuda z eksperckiej grupy ds Sztucznej Inteligencji Stowarzyszenia Autorów ZAiKS.
ZAiKS (historycznie skrót od Związek Autorów i Kompozytorów Scenicznych) jest polską organizacją zbiorowego zarządzania prawami autorskimi. Głównym celem ZAiKS-u jest ochrona autorskich praw majątkowych. Organizacja działa na rzecz rozwoju twórczości, doskonalenia jej ochrony, zwłaszcza w związku z rozwojem nowych technik oraz prowadzi też działalność socjalną na rzecz swoich członkiń i członków. ZAiKS udziela licencji na korzystanie z utworów, pobiera wynagrodzenia autorskie od instytucji wykorzystujących twórczość i wypłaca autorkom i autorom tantiemy.
Rola ZAiKS-u w pilnowaniu praw polskich lub operujących na polskim rynku twórczyń i twórców jest kluczowa, ale Stowarzyszenie, jak wszystkie organizacje, może funkcjonować tylko w ramach prawa. A w myśl tego obowiązującego w Polsce ochronie podlegają utwory, które są przejawem działalności twórczej o indywidualnym charakterze, odzwierciedlającym osobowość autora. Twórcy mogą liczyć na pełne wsparcie swojej branży, z ZAiKS-em na czele, jeżeli dany podmiot przywłaszczy sobie daną kompozycję czy nagranie. A co z imitowaniem samego artysty? - To są dobra osobiste i są chronione przez inne przepisy niż prawo autorskie - mówi Łabuda.
Prawo w kwestii syntetycznej twórczości jest niestety dość mgliste. Na drodze cywilnej poszkodowany artysta może żądać od sprawcy zaniechania naruszania jego dóbr osobistych, usunięcia skutków naruszenia, złożenia oświadczenia odpowiedniej treści i formy oraz zadośćuczynienia pieniężnego lub zapłaty sumy na cel społeczny. Jeśli wskutek naruszenia dobra osobistej została wyrządzona szkoda majątkowa, np. utrata dochodu lub koszty leczenia, poszkodowany może żądać jej naprawienia na zasadach ogólnych.
Na drodze karnej podmiot syntetyzujący innego artystę może być pociągnięty do odpowiedzialności za popełnienie przestępstwa z art. 190a kodeksu karnego, który stanowi: Kto bez uprawnienia używa cudzego nazwiska lub pseudonimu albo podaje się za inną osobę albo przedstawia się fałszywie pod względem swojej tożsamości, cech osobistych lub stosunków prawnych, podlega grzywnie, karze ograniczenia wolności albo pozbawienia wolności do roku.
Ponadto osoba udająca kogoś innego może popełnić inne przestępstwa związane z naruszeniem dóbr osobistych, np. zniesławienie, pomówienie, naruszenie tajemnicy korespondencji czy wyłudzenie. - Straty wizerunkowe dla osób publicznych - artystów, wykonawców to poważne zagrożenie i potencjalnie wielkie straty finansowe. Sąd nie będzie pobłażliwy - twierdzi Łabuda.
Na szczęście branża nie unika tego problemu. - ZAiKS należy do wszystkich europejskich i światowych organizacji parasolowych zrzeszających organizacje zbiorowego zarządzania. Świadomość praw i wola ich ochrony jest w Polsce taka sama jak na największych rynkach. W porównaniu do silnych obywatelsko i świadomych wartości własnej kultury krajów gorzej wdrażamy na przykład dyrektywy europejskie chroniące lokalne rynki kreatywne. Lobbing największych firm technologicznych w Polsce jest o wiele skuteczniejszy niż w takich krajach jak Francja, Niemcy, Włochy czy Hiszpania, które wywalczyły na przykład współfinansowanie kultury przez korporacje, które przecież na naszej kulturze zarabiają - mówi Jerzy Łabuda.
Gdzie w tym wszystkim jest Polska?
Łabuda dodaje jednak, że Polskę można śmiało umieścić w awangardzie technologicznej. System zaiks.online należy do najbardziej rozbudowanych i skutecznych systemów sektora finansowego - analizuje użycie i rozlicza tantiemy z największych platform cyfrowych, co wymaga olbrzymiej siły obliczeniowej i cyberbezpieczeństwa rodem z sektora bankowego. - Prowadzimy dialog z platformami usług cyfrowych o tym, jak mają być analizowane i rozliczane utwory powstałe z udziałem SI. Utworzyliśmy nasz wewnętrzny "AI think-tank" i współpracujemy z wieloma wybitnymi specjalistami z kraju i zagranicy, na bieżąco obserwujemy postępy prawa i technologii. Przygotowujemy rekomendacje i pomoc dla prawodawców, którzy zresztą takich opinii szukają i chętnie biorą pod uwagę głosy spoza świata technologicznego lobbingu - opowiada Łabuda.
Ostrzega też przed agentami, wytwórniami i innymi podmiotami żerującymi na niewiedzy artystów. Chodzi o umowy buy-out, które nierzadko i chętnie są oferowane wykonawcom. Polegają na tym, że za jednorazową zapłatę twórca przenosi prawa majątkowe na kupującego. Spider’s Web opisywał niedawno przypadek lektora, który użyczył swojego głosu dostawcy oprogramowania do nawigacji GPS, podpisując tego rodzaju umowę - a dziś słyszy swój głos w licznych kreacjach reklamowych, przy nagrywaniu których nie brał udziału i za co nie otrzymuje wynagrodzenia.
- To jest dla twórców bardzo niekorzystne rozwiązanie, ale wiele instytucji wymusza podpisywanie tego typu umów, zazwyczaj za pomocą szantażu lub dzięki nieświadomości twórcy. W każdym razie wykorzystują dominującą pozycję na rynku. Zjawisko dotyczy zarówno twórców reklam, jak i muzyki, scenariuszy, zdjęć, choreografii. Chcemy przestrzec wszystkich twórców, że w ich interesie, w interesie ich przyszłości jest nieoddawanie swoich praw. Tantiemy są na zawsze, także dla spadkobierców. Jednorazowa wypłata… jest jednorazowa - komentuje Jerzy Łabuda z eksperckiej grupy ds. Sztucznej Inteligencji Stowarzyszenia ZAiKS.
Bez nowoczesnego prawa o ochronie artystów nie może być mowy. Od grania bez fałszu istotniejsze się wydaje być granie fair.
A nawet bez dyskusji o tym, kim właściwie jest artysta. Wszak nawet najbardziej zaawansowana sztuczna inteligencja niezmiennie wymaga promptera, czyli osoby tworzącej polecenia do generatora. Im umiejętniej napisany prompt, tym potencjalnie lepszy będzie efekt końcowy, czyli wygenerowany utwór. Trudno tu pomijać rolę promptera - tym niemniej cóż z tego, skoro jego dzieło to potencjalnie imitacja. Być może nawet nie z winy operatora, a zasady działania wykorzystanego narzędzia lub danych, na których było szkolone.
Sztuka generatywnej SI stawia więc przed polskim (i nie tylko polskim) prawem autorskim wiele wyzwań, które dotyczą zarówno kwestii ochrony prawnej, jak i odpowiedzialności za naruszenia. Czyli:
- Brak jasnej definicji i kryteriów ochrony utworów SI. Polskie prawo autorskie wymaga, aby utwór był przejawem działalności twórczej o indywidualnym charakterze, ustalonym w jakiejkolwiek postaci. Jednak nie określa ono, czy i kiedy utwór generowany spełnia te warunki, ani jak oceniać indywidualność i twórczość systemu komputerowego. Nie wiadomo więc, czy utwór taki może być uznany za oryginalny i odzwierciedlający osobowość autora, czy też jest tylko efektem algorytmu i danych wejściowych.
- Brak uregulowania statusu prawnego twórcy i właściciela utworu generowanego. Polskie prawo autorskie przyznaje prawa autorskie wyłącznie człowiekowi jako twórcy utworu. Nie uwzględnia ono możliwości, że twórcą może być system komputerowy lub że może on współtworzyć utwór z człowiekiem. Nie określa też, kto jest właścicielem praw autorskich do takiego utworu - czy jest to programista, użytkownik, dostawca danych czy sam system komputerowy. Nie wiadomo więc, kto może rozporządzać utworem SI i czerpać z niego korzyści.
- Brak dostosowania zakresu i granic praw autorskich do specyfiki utworów SI. Polskie prawo autorskie przyznaje twórcy utworu szereg praw osobistych i majątkowych, które mają na celu ochronę jego interesów moralnych i ekonomicznych. Jednak nie uwzględnia ono, że utwory SI mogą być tworzone w sposób automatyczny, masowy, zmienny lub interaktywny. Nie wiadomo więc, jak stosować np. prawo do autorstwa, do nienaruszalności treści i formy, do rozpowszechniania, do publicznego odtwarzania czy do adaptacji w odniesieniu do utworów SI.
- Brak uregulowania odpowiedzialności za naruszenia praw autorskich związane z utworami SI. Polskie prawo autorskie przewiduje odpowiedzialność cywilną i karną za naruszenia praw autorskich, ale nie określa ono, kto ponosi odpowiedzialność za naruszenia dokonane przez system komputerowy lub z jego udziałem. Nie wiadomo więc, kto odpowiada za np. plagiat, naruszenie dóbr osobistych, wykorzystanie bezprawne czy nadużycie prawa cytatu w przypadku utworów SI.
Problem w tym, że bieżąca rewolucja nie baczy na opieszałość ustawodawcy. ZAiKS i jego odpowiedniki na innych rynkach nie próżnują, oferując zainteresowanym ekspertyzy, badania i rekomendacje i dobrze umotywowane postulaty. Reakcja branży jest jednak rozczarowująco powolna - podczas gdy nadal prowadzone są głównie rozmowy, jedna z wytwórni muzycznych zdecydowała się zalać Spotify dziesiątkami tysięcy utworów generowanych przez SI. Koszt takiej manufaktury był znikomy - a przecież wystarczy, by kilka procent z tych utworów jakkolwiek zdobyło popularność, by być promowanymi przez algorytmy Spotify i rywalizować z muzyką tworzoną tradycyjnie.
Wydaje się mimo wszystko wątpliwym, byśmy właśnie byli świadkami zmierzchu muzyki rozrywkowej komponowanej przez człowieka. Muzyka to nie tylko sprawne rzemiosło, ale też osobowość, natchnienie czy nawet prezencja danego artysty. Nie brakuje przykładów piosenkarzy czy zespołów, które kompletnie nie umieją grać w ujęciu technicznym - ale poruszyły serca milionów talentem skutecznego przekazywania emocji językiem beatu i melodii. Takiego punktu odniesienia w przypadku muzyki syntetycznej brakuje.
Syntezatory dźwięku i cyfrowe narzędzia produkcyjne nie zabiły instrumentów analogowych, generatywna SI prawdopodobnie nie zakończy ery muzyki komponowanej w całości przez ludzi. Bezosobowość nie zwalnia jej jednak z etycznego współuczestnictwa w popkulturze. By tego dopilnować, konieczne jest dobre prawo, które można by było egzekwować. Na nie, niestety, wciąż czekamy.