Ile warty jest twój komentarz pod memem lub zdjęciem? Nie chcesz karmić AI, unikaj tej strony

Zdarzyło ci się zostawić komentarz na Redditcie? Wkrótce on, jak i miliardy postów i komentarzy staną się pożywką dla sztucznej inteligencji. Bowiem firma szukając kolejnych źródeł zysku, podpisała milionowy kontrakt, dzięki któremu treści w serwisie będą mogły być wykorzystywane do treningu AI.

Malwina Kuśmierek

19.02.2024 10:04

Dodaj do ulubionych w GoogleDodaj do ulubionych źródeł w Google

Nie chcesz stać się materiałem treningowym dla AI? Unikaj tej społecznościówki

To jak dobrze generatywna sztuczna inteligencja będzie tworzyć treści (niezależnie czy jest to tekst, grafika czy wideo) w dużej mierze zależy od ilości i jakości danych, które zostaną użyte do treningu. W każdym z tych przypadków istnieją dane, które dowolna firma może wykorzystać bez zbędnej papierologii - mowa tu konkretnie o specjalnie przygotowanych datasetach (zbiorach danych) oraz publikacjach dostępnych w ramach domeny publicznej.

Jednak oba te typy są niezbyt atrakcyjne dla firm zajmujących się AI. Z trzech powodów: dostęp do nich ma każdy (brak unikalności), są one małe (dostarczając danych dotyczących tylko oczywistych kwestii) i często są one przedawnione, nie dostarczając AI aktualnych informacji.

Ile wart jest twój komentarz pod memem lub zdjęciem? Na Redditcie przynajmniej grosz

Media społecznościowe - jako źródło danych treningowych - to pod każdym względem kompletne przeciwieństwo specjalnie przygotowanych zbiorów danych i wolnej domeny. Świeże, przedstawiające obecne trendy, normy językowe czy zachowania, miliony codziennie robionych zdjęć oraz gdzieniegdzie wkład ekspercki pisany prostym do zrozumienia językiem.

Pod tym względem o wartości social mediów zdaje sobie sprawę zarówno Meta, jak i Elon Musk. Bowiem każde z nich nie pozwala na trening AI na podstawie danych ze swoich społecznościówek. Jednocześnie tak Facebook i Instagram, jak i X (dawny Twitter) obecnie posiadają własne chatboty wytrenowane właśnie na danych pochodzących od użytkowników.

W inny sposób podchodzi do tego serwis Reddit, który właśnie podpisał milionowy kontrakt, w myśl którego bliżej nieokreślona firma uzyskała pozwolenie na trenowanie sztucznej inteligencji na treściach publikowanych w serwisie. Jak informuje Bloomberg, umowa opiewa na sumę 60 milionów dolarów rocznie. Dla porównania ubiegłoroczny całkowity dochód platformy to nieco ponad 800 milionów dolarów.

Kontrakt podpisano na krótko przed spodziewaną pierwszą ofertą publiczną (IPO), czyli pierwszym publicznym zaoferowaniem akcji do sprzedaży na giełdzie, w celu pozyskania kapitału i zwiększenia swojej widoczności na rynku. Ponadto według anonimowych informatorów umowa ma służyć jako model dla podobnych kontraktów w przyszłości.

Reddit może wejść na giełdę już w przyszłym miesiącu z wyceną 5 miliardów dolarów. Jak zauważa Bloomberg, w ten sposób Reddit chce przekonać do siebie inwestorów, pokazując im, że firma może zwiększać swoje przychody dzięki umowom z firmami zajmującymi się sztuczną inteligencją i uczeniem maszynowym. Na podobny krok zdecydował się także niemiecki koncern wydawniczy Axel Springer SE, który w grudniu podpisał podobny, wielomilionowy kontrakt z OpenAI, dzięki któremu modele z serii GPT (i nie tylko) będą mogły być trenowane na treściach z Politico, Business Insider, ale także Bild czy Die Welt.

Może zainteresować cię także:

Zdjęcie główne: Diego Thomazini / Shutterstock

Malwina Kuśmierek

Redaktor

Tagi:

Reddit Sztuczna inteligencja (AI)