REKLAMA

Halo, policja, proszę przyjechać do internetu. Bot ukradł Koreańczykom kapustę, a Polakom Skłodowską

Koreańczycy pieklą się, że DeepSeek nazywa kimchi daniem kuchni chińskiej. Ten sam chatbot nazywa Marię Skłodowską-Curie "Marią Curie", a mimo to internetowe bojówki skierowały swoje siły w stronę duńskiego producenta klocków.

Halo, policja, proszę przyjechać do internetu. Bot ukradł Koreańczykom kapustę, a Polakom Skłodowską
REKLAMA

Każdy, kto przebywał w internecie dłużej niż godzinę, prawdopodobnie wie, że najszybszym sposobem na wywołanie ustawki polskojęzycznych bojówek internetowych jest nazwanie Marii Skłodowskiej-Curie "Marią Curie". Nazywanie polskiej badaczki jedynie z użyciem nazwiska jej męża nie jest obiektywnie złe - dzięki zachowaniu wielu listów i dokumentów wiemy, że sama noblistka podpisywała się jako "Maria Curie" lub "Maria Curie-Skłodowska". Ponadto ówczesne konwencje społeczeństwa francuskiego sprawiły, że Polka była znana bardziej pod nazwiskiem "Curie" niż "Skłodowska-Curie", i to właśnie przez te standardy zdobyła sławę jako "Maria Curie".

REKLAMA

Prowadzimy nagonkę na klocki LEGO. A gdzie nagonka na generatywną AI?

Mimo to w Polsce za prawidłową pisownię nazwiska uznaje się Skłodowska-Curie, o czym również świadczą zachowane dokumenty, zapiski encyklopedyczne i naukowe, Polska konwencja nazwiska panieńskiego przed nazwiskiem męża, jak i przywiązanie noblistki do ojczyzny.

Dlatego każdorazowy "incydent" nazwania Marii Skłodowskiej-Curie jedynie "Marią Curie" wywołuje emocje i mniej lub bardziej niewybredne komentarze. Tak było w przypadku nowego zestawu LEGO Ideas "Ewolucja przedmiotów ścisłych", w którym znajdziemy figurkę Marii Skłodowskiej-Curie. W polskojęzycznych materiałach prasowych, marketingowych, jak i na stronie w sklepie LEGO noblistka była nazywana pełnym, dwuczłonowym nazwiskiem - począwszy od nazwiska panieńskiego.

Jednak w materiałach anglojęzycznych i nie tylko, figurowała jako "Maria Curie" co, powiem delikatnie, pobudziło dyskusję w internecie. Na duńską firmę krytyka spadła praktycznie we wszystkich kanałach, w tym oczywiście w mediach społecznościowych, jakoby ta miała "zapomnieć" że Skłodowska-Curie jest Polką.

Jednak nikt, ale to absolutnie nikt nie pobudził dyskusji na temat tego, że problem na dużo większą skalę istnieje w systemach generatywnej sztucznej inteligencji.

Równolegle do skandalu wokół zestawu LEGO, w koreańskich mediach toczy się dyskusja na temat "chińskiego kimchi". A to ze względu na fakt, że chatbot DeepSeek zapytany w języku koreańskim o tradycyjne koreańskie danie ze sfermentowanych warzyw powie, że pochodzi ono z Korei. Jednak to samo zapytanie w języku angielskim lub chińskim sprawi, że DeepSeek przypisze pochodzenie kimchi jako chińskie. Koreańska agencja Yonhap pociągnęła temat dalej i również inne elementy kultury koreańskiej, w zależności od użytego języka, były opisywane jako chińskie. Sprawa jest na tyle poważna, że koreańskie służby wywiadowcze zareagowały, wydając komunikat o zachowaniu ostrożności przy korzystaniu z DeepSeek.

Na tej samej zasadzie postanowiłam sprawdzić jaką pisownię "Marii Skłodowskiej-Curie" w różnych językach zasugerują chatboty ChatGPT oraz DeepSeek. Jednak nie zapytałam wprost "pisze się Curie czy Skłodowska Curie", lecz zapytałam w kilku europejskich językach: "Jak nazywa się Maria, która odkryła promieniotwórcze pierwiastki".

Jestem pewna, że nawet bez znajomości języków obcych można łatwo zauważyć, że w języku polskim i niemieckim ChatGPT mówi o Skłodowskiej-Curie, podczas gdy w angielskim i francuskim noblistka nazywana jest jedynie z użyciem nazwiska jej męża.

W przypadku DeepSeek odpowiedzi w języku polskim i francuskim zawierały pełne nazwisko Maria Skłodowska-Curie, z kolei w języku angielskim i niemieckim była mowa o Marie Curie.

Z Marią Curie mamy do czynienia także w języku włoskim oraz hiszpańskim - i prawdopodobnie w jeszcze wielu innych językach. A to z prostego powodu: uprzedzeń wynikających z użytych danych treningowych. Choć w tym przypadku zjawisko jest stosunkowo niegroźne - forma Maria Curie jest dopuszczalna, a chatboty w większości przypadków zaznaczały polskie pochodzenie noblistki, to mimo wszystko jest on niebezpiecznym precedensem dla tego typu odpowiedzi.

"Granice mojego języka wyznaczają granice mojego świata"

W ubiegłym roku grupa naukowców-wolontariuszy z grupy Data Provenance Initiative opublikowała dość niepokojący raport, który pokazuje skąd pochodzą dane treningowe używane w procesie uczenia maszynowego różnego rodzaju systemów sztucznej inteligencji - w tym naszych ulubionych chatbotów. Największy udział w danych treningowych AI mają m.in. encyklopedie, publikacje prasowe czy książki. Trenując polskojęzyczny system na polskojęzycznych treściach, obecność formy Skłdowska-Curie jest wręcz oczywista. Jednak w tych samych zbiorach w języku chorwackim, w którym ze względu kulturowych pozalaboratoryjna osoba noblistki nie jest aż taka ważna, użycie "Skłodowskiej-Curie" nie jest aż tak oczywiste. Podobnie jest w języku angielskim - choć żadne źródło pisane nie ujmie Marii Skłodowskiej-Curie, że jest polką, to będzie w nich powielana przyjęta na początku XX wieku francuska forma "Maria Curie".

Treści anglojęzyczne w systemach generatywnej AI stanowią około 90 proc. wszystkich treści - a tam, gdzie AI brakuje danych z konkretnego języka, zwykle posila się ona albo halucynując, albo na poczekaniu tłumacząc z języka angielskiego. Co oznacza, że w wielu kwestiach będziemy mieć do czynienia z anglosaską percepcją rzeczywistości. A w przypadku DeepSeek, także tą manipulowaną przez chiński rząd. Choć teraz mówimy o kwestiach stosunkowo niegroźnych dla ogółu, to efekt kuli śnieżnej pchanej przez jednostronny obraz świata - i to pieczołowicie polerowany przez podmioty, nad którymi nie mamy kontroli - szybko odbije nam się czkawką.

REKLAMA

Koreańczycy bardzo szybko zauważyli problem opisu kimchi przez chiński DeepSeek, jednak my w obliczu identycznego problemu ze strony amerykańskich czatbotów, nadal prowadzimy nagonkę na profilu LEGO na Facebooku. Pomimo że chatboty, które każdy z nas ma w telefonie, mogą z łatwością powiedzieć, że Maria Curie to francuska noblistka. A w bardziej nihilistycznym, wręcz katastroficznym scenariuszu, że Mickiewicz jest Litwinem, obozy śmierci były polskie i że to Turing odszyfrował enigmę.

Zdjęcie główne: ku4 / Shutterstock

REKLAMA
Najnowsze
Zobacz komentarze
REKLAMA
REKLAMA
REKLAMA