ChatGPT to złodziej? OpenAI i Microsoftowi grozi gigantyczna kara
OpenAI już wielokrotnie musiało się tłumaczyć ze źródeł danych, jakie wykorzystał do szkolenia swoich modeli językowych GPT. Zarzuty są poważne i sugerują, że firma w wielu kwestiach nagięła prawo i obrała drogę na skróty. Niewykluczone, że niebawem będzie musiała za to zapłacić. Podobnie jak jej strategiczny partner.
ChatGPT i Bing Czat to usługi wykorzystujące model językowy GPT od OpenAI. To właśnie za jego sprawą oba czatboty sprawiają wrażenie superinteligentnych i wszechwiedzących. Ów GPT nie jest jednak żadną czarną magią czy algorytmem pozyskanym od kosmitów. To model SI, który powstał za sprawą analizy i przetworzenia ogromnej, niewyobrażalnej ilości danych. Tyle że przecież nie ma czegoś takiego, jak darmowe dane. Skąd je pozyskał OpenAI?
To jest dobre pytanie i nic dziwnego, że rodzi istotne podejrzenia, że dane te zostały pozyskane nielegalnie. Możliwe wręcz, że na drodze kradzieży. Jeżeli ten zarzut uda się udowodnić przed sądem, może to kosztować OpenAI ogromną kwotę. A także znajdującego się z firmą w sojuszu Microsoft.
Trzy miliardy dolarów kary dla OpenAI i Microsoftu? Pod warunkiem, że ChatGPT okaże się złodziejem.
Liczący 157 stron pozew został złożony w sądzie federalnym w San Francisco. Zarzuca on OpenAI i Microsoftowi kradzież danych ich posiadaczy i ich przetworzenie, bez uprzedniego poinformowania właścicieli, pozwolenia czy uiszczenia opłaty. Według dokumentu, firmy zeskanowały dokumenty o łącznej długości 300 mld słów, w tym objęte prawami autorskimi książki, artykuły prasowe i wypowiedzi w social mediach, w tym zawierające wrażliwe informacje osobiste.
W pozwie znajduje się też adnotacja o możliwości dodatkowego przetworzenia tych danych w nielegalny sposób, nie tylko celem szkolenia Dużego Modelu Językowego. Dane te, jak stara się wykazać firma prawnicza Clarkson Law Firm odpowiedzialna za pozew, mogą być wykorzystywane do profilowania użytkowników.
Zarzuty dotyczą też niewłaściwego zabezpieczenia tych danych. Jak wykazuje pozew, model językowy GPT jak najbardziej jest w stanie wygenerować odpowiedzi zawierające cudze wrażliwe dane. ChatGPT i Bing Czat mają relatywnie proste zabezpieczenia, by filtrować te wypowiedzi i nie prezentować ich użytkownikowi. Zdaniem Clarkson Law Firm, to stanowczo zbyt mało niż opisuje prawo.
To dużo pieniędzy nawet dla gigantów Big Tech. Czy faktycznie przełom związany z GPT to efekt bezczelnej kradzieży?
Generatywna sztuczna inteligencja już zaczęła zmieniać świat - na podobny sposób, jaki zmienił go smartfon. To bez wątpienia rewolucja, która zmieni informatykę na coś zupełnie innego, prawdopodobnie lepszego. Rewolucje, wbrew powszechnemu porzekadłu, nie powinny jednak wymagać ofiar i działania wbrew prawu. Czy Microsoft i OpenAI owo prawo złamały?
Na nieszczęście obu firm, pozew jest dobrze umotywowany i udokumentowany. Załączone do niego są różne wypowiedzi autorytetów branży, naukowców zajmujących się informatyką, dziennikarzy i ekspertów. Słabym punktem pozwu jest tylko szacunek kwotowy 3 mld dol. Według amerykańskiego prawa, należy udowodnić szkodę, jaką wykazało działanie pozwanych firm i na tej podstawie ustalana jest potencjalna kara bądź grzywna. Clarkson Law Firm nie był w stanie jej oszacować.
Na dziś nie jest jasne co ewentualna przegrana Microsoftu i OpenAI mogłaby oznaczać, poza pozbyciem się istotnej kwoty. Wydaje się wątpliwe, by ewentualny niekorzystny dla Big Techów wyrok był w stanie powstrzymać trwającą już rewolucję. Z drugiej strony warto mieć na uwadze, że póki co podobne zarzuty nie są jeszcze stawiane Google’owi, Mecie i Amazonowi pracujących nad konkurencją dla GPT. Czyżby OpenAI zyskało swoją przewagę techniczną za sprawą nieetycznych i niezgodnych z prawem praktyk? Dowiemy się za sprawą drobiazgowego śledztwa.
*Ilustracja otwierająca: Iryna Imago / Shutterstock