REKLAMA

Halo, policja, proszę przyjechać do internetu. Bot ukradł Koreańczykom kapustę, a Polakom Skłodowską

Koreańczycy pieklą się, że DeepSeek nazywa kimchi daniem kuchni chińskiej. Ten sam chatbot nazywa Marię Skłodowską-Curie "Marią Curie", a mimo to internetowe bojówki skierowały swoje siły w stronę duńskiego producenta klocków.

Halo, policja, proszę przyjechać do internetu. Bot ukradł Koreańczykom kapustę, a Polakom Skłodowską
REKLAMA

Każdy, kto przebywał w internecie dłużej niż godzinę, prawdopodobnie wie, że najszybszym sposobem na wywołanie ustawki polskojęzycznych bojówek internetowych jest nazwanie Marii Skłodowskiej-Curie "Marią Curie". Nazywanie polskiej badaczki jedynie z użyciem nazwiska jej męża nie jest obiektywnie złe - dzięki zachowaniu wielu listów i dokumentów wiemy, że sama noblistka podpisywała się jako "Maria Curie" lub "Maria Curie-Skłodowska". Ponadto ówczesne konwencje społeczeństwa francuskiego sprawiły, że Polka była znana bardziej pod nazwiskiem "Curie" niż "Skłodowska-Curie", i to właśnie przez te standardy zdobyła sławę jako "Maria Curie".

REKLAMA

Prowadzimy nagonkę na klocki LEGO. A gdzie nagonka na generatywną AI?

Mimo to w Polsce za prawidłową pisownię nazwiska uznaje się Skłodowska-Curie, o czym również świadczą zachowane dokumenty, zapiski encyklopedyczne i naukowe, Polska konwencja nazwiska panieńskiego przed nazwiskiem męża, jak i przywiązanie noblistki do ojczyzny.

Dlatego każdorazowy "incydent" nazwania Marii Skłodowskiej-Curie jedynie "Marią Curie" wywołuje emocje i mniej lub bardziej niewybredne komentarze. Tak było w przypadku nowego zestawu LEGO Ideas "Ewolucja przedmiotów ścisłych", w którym znajdziemy figurkę Marii Skłodowskiej-Curie. W polskojęzycznych materiałach prasowych, marketingowych, jak i na stronie w sklepie LEGO noblistka była nazywana pełnym, dwuczłonowym nazwiskiem - począwszy od nazwiska panieńskiego.

Jednak w materiałach anglojęzycznych i nie tylko, figurowała jako "Maria Curie" co, powiem delikatnie, pobudziło dyskusję w internecie. Na duńską firmę krytyka spadła praktycznie we wszystkich kanałach, w tym oczywiście w mediach społecznościowych, jakoby ta miała "zapomnieć" że Skłodowska-Curie jest Polką.

Jednak nikt, ale to absolutnie nikt nie pobudził dyskusji na temat tego, że problem na dużo większą skalę istnieje w systemach generatywnej sztucznej inteligencji.

Równolegle do skandalu wokół zestawu LEGO, w koreańskich mediach toczy się dyskusja na temat "chińskiego kimchi". A to ze względu na fakt, że chatbot DeepSeek zapytany w języku koreańskim o tradycyjne koreańskie danie ze sfermentowanych warzyw powie, że pochodzi ono z Korei. Jednak to samo zapytanie w języku angielskim lub chińskim sprawi, że DeepSeek przypisze pochodzenie kimchi jako chińskie. Koreańska agencja Yonhap pociągnęła temat dalej i również inne elementy kultury koreańskiej, w zależności od użytego języka, były opisywane jako chińskie. Sprawa jest na tyle poważna, że koreańskie służby wywiadowcze zareagowały, wydając komunikat o zachowaniu ostrożności przy korzystaniu z DeepSeek.

Na tej samej zasadzie postanowiłam sprawdzić jaką pisownię "Marii Skłodowskiej-Curie" w różnych językach zasugerują chatboty ChatGPT oraz DeepSeek. Jednak nie zapytałam wprost "pisze się Curie czy Skłodowska Curie", lecz zapytałam w kilku europejskich językach: "Jak nazywa się Maria, która odkryła promieniotwórcze pierwiastki".

Jestem pewna, że nawet bez znajomości języków obcych można łatwo zauważyć, że w języku polskim i niemieckim ChatGPT mówi o Skłodowskiej-Curie, podczas gdy w angielskim i francuskim noblistka nazywana jest jedynie z użyciem nazwiska jej męża.

W przypadku DeepSeek odpowiedzi w języku polskim i francuskim zawierały pełne nazwisko Maria Skłodowska-Curie, z kolei w języku angielskim i niemieckim była mowa o Marie Curie.

Z Marią Curie mamy do czynienia także w języku włoskim oraz hiszpańskim - i prawdopodobnie w jeszcze wielu innych językach. A to z prostego powodu: uprzedzeń wynikających z użytych danych treningowych. Choć w tym przypadku zjawisko jest stosunkowo niegroźne - forma Maria Curie jest dopuszczalna, a chatboty w większości przypadków zaznaczały polskie pochodzenie noblistki, to mimo wszystko jest on niebezpiecznym precedensem dla tego typu odpowiedzi.

"Granice mojego języka wyznaczają granice mojego świata"

W ubiegłym roku grupa naukowców-wolontariuszy z grupy Data Provenance Initiative opublikowała dość niepokojący raport, który pokazuje skąd pochodzą dane treningowe używane w procesie uczenia maszynowego różnego rodzaju systemów sztucznej inteligencji - w tym naszych ulubionych chatbotów. Największy udział w danych treningowych AI mają m.in. encyklopedie, publikacje prasowe czy książki. Trenując polskojęzyczny system na polskojęzycznych treściach, obecność formy Skłdowska-Curie jest wręcz oczywista. Jednak w tych samych zbiorach w języku chorwackim, w którym ze względu kulturowych pozalaboratoryjna osoba noblistki nie jest aż taka ważna, użycie "Skłodowskiej-Curie" nie jest aż tak oczywiste. Podobnie jest w języku angielskim - choć żadne źródło pisane nie ujmie Marii Skłodowskiej-Curie, że jest polką, to będzie w nich powielana przyjęta na początku XX wieku francuska forma "Maria Curie".

Treści anglojęzyczne w systemach generatywnej AI stanowią około 90 proc. wszystkich treści - a tam, gdzie AI brakuje danych z konkretnego języka, zwykle posila się ona albo halucynując, albo na poczekaniu tłumacząc z języka angielskiego. Co oznacza, że w wielu kwestiach będziemy mieć do czynienia z anglosaską percepcją rzeczywistości. A w przypadku DeepSeek, także tą manipulowaną przez chiński rząd. Choć teraz mówimy o kwestiach stosunkowo niegroźnych dla ogółu, to efekt kuli śnieżnej pchanej przez jednostronny obraz świata - i to pieczołowicie polerowany przez podmioty, nad którymi nie mamy kontroli - szybko odbije nam się czkawką.

REKLAMA

Koreańczycy bardzo szybko zauważyli problem opisu kimchi przez chiński DeepSeek, jednak my w obliczu identycznego problemu ze strony amerykańskich czatbotów, nadal prowadzimy nagonkę na profilu LEGO na Facebooku. Pomimo że chatboty, które każdy z nas ma w telefonie, mogą z łatwością powiedzieć, że Maria Curie to francuska noblistka. A w bardziej nihilistycznym, wręcz katastroficznym scenariuszu, że Mickiewicz jest Litwinem, obozy śmierci były polskie i że to Turing odszyfrował enigmę.

Zdjęcie główne: ku4 / Shutterstock

REKLAMA
Najnowsze
Aktualizacja: 2025-06-18T21:08:40+02:00
Aktualizacja: 2025-06-18T20:07:49+02:00
Aktualizacja: 2025-06-18T18:28:03+02:00
Aktualizacja: 2025-06-18T17:53:56+02:00
Aktualizacja: 2025-06-18T17:38:40+02:00
Aktualizacja: 2025-06-18T17:06:25+02:00
Aktualizacja: 2025-06-18T16:29:59+02:00
Aktualizacja: 2025-06-18T16:15:30+02:00
Aktualizacja: 2025-06-18T15:41:16+02:00
Aktualizacja: 2025-06-18T15:23:11+02:00
Aktualizacja: 2025-06-18T14:41:01+02:00
Aktualizacja: 2025-06-18T13:02:25+02:00
Aktualizacja: 2025-06-18T12:32:56+02:00
Aktualizacja: 2025-06-18T11:13:24+02:00
Aktualizacja: 2025-06-18T10:51:28+02:00
Aktualizacja: 2025-06-18T09:29:43+02:00
Aktualizacja: 2025-06-18T08:27:25+02:00
Aktualizacja: 2025-06-18T07:40:53+02:00
Aktualizacja: 2025-06-18T06:56:00+02:00
Aktualizacja: 2025-06-18T06:45:00+02:00
Aktualizacja: 2025-06-18T06:23:00+02:00
Aktualizacja: 2025-06-17T21:55:35+02:00
Aktualizacja: 2025-06-17T21:41:40+02:00
Aktualizacja: 2025-06-17T20:08:35+02:00
Aktualizacja: 2025-06-17T20:00:50+02:00
Aktualizacja: 2025-06-17T18:37:23+02:00
Aktualizacja: 2025-06-17T14:00:16+02:00
REKLAMA
REKLAMA
REKLAMA