Rosja zalewa Wikipedię. Potop kłamstw i dezinformacji
Rosyjska propaganda zalewa Wikimedia Commons i trafia prosto do AI. To może zmienić to, co widzisz w sieci.

Wikipedia miała być pamięcią świata: otwartą, wspólną i odporną na manipulacje dzięki milionom czujnych oczu. Dziś jednak gra toczy się na zupełnie innym poziomie. W erze sztucznej inteligencji nie liczy się już tylko to, co przeczyta człowiek. Liczy się to, co połknie bot, co przemieli model językowy i co odda nam później jako gładką, pewną siebie odpowiedź. W takim świecie nawet niewinne zdjęcie, podpis czy metadane mogą zamienić się w broń.
Problem zaczyna się nie tam, gdzie myślisz
Ktoś coś dopisał, ktoś inny poprawił, moderatorzy patrzą, społeczność dyskutuje, a po czasie zostaje wersja najbliższa faktom. Taki obraz coraz gorzej opisuje jednak rzeczywisty problem. Chodzi bowiem nie tylko o same artykuły, ale także o Wikimedia Commons, czyli ogromne repozytorium multimediów: zdjęć, grafik, nagrań audio i filmów na wolnych licencjach.
To właśnie tam mogą trafiać materiały pochodzące z rosyjskich źródeł państwowych lub prorosyjskich mediów. Na pierwszy rzut oka wszystko może wyglądać poprawnie: plik ma licencję, opis, autora, datę, miejsce i pewną wartość edukacyjną. Problem zaczyna się wtedy, gdy jedna strona konfliktu produkuje i udostępnia takie materiały masowo, a druga nie robi tego w tej samej skali albo nie ma takich samych praw licencyjnych.
W efekcie otwarte repozytorium, które miało być neutralnym magazynem wiedzy, może zacząć przechylać obraz świata. Nie dlatego, że ktoś dopisał wielkimi literami propagandowe hasło. Wystarczy, że na dany temat dostępne będą głównie materiały z jednego źródła, opisane jego językiem i osadzone w jego kadrach.
Krym jako brutalny poligon wojny o pamięć
Najbardziej wymowny jest przykład aneksji Krymu. Jak podaje Prezes Instytutu Technologii Społeczno-Politycznych Kybernetes oraz członek Rady Konsultacyjnej ds. Odporności na Dezinformację Międzynarodową przy Ministrze Spraw Zagranicznych Marcin Żabiński w rozmowie z PAP, przy wyszukiwaniu materiałów związanych z Krymem w Wikimedia Commons znacząca część wyników prowadzi do rosyjskich źródeł, w tym oficjalnych materiałów państwowych lub mediów powiązanych z rosyjską narracją. Wśród nich znajdują się nagrania i zdjęcia pokazujące wiece poparcia dla przyłączenia Krymu do Rosji, polityczne gesty oraz oficjalne sceny z podpisywania dokumentów.
Taki zestaw materiałów nie musi wprost kłamać, żeby działać propagandowo. Wystarczy, że pokazuje rzeczywistość przez filtr jednego państwa i jednej narracji. Jeśli w repozytorium łatwiej znaleźć obrazy rosyjskiej ceremonii niż ukraińskich strat, protestów, przymusu, represji i konsekwencji okupacji, użytkownik dostaje zniekształcony obraz wydarzeń.
To jest wojna o pamięć, tylko prowadzona w mniej widowiskowy sposób. Nie przez wielki baner z napisem Rosja ma rację, lecz przez tysiące małych elementów: zdjęcia, podpisy, kategorie, opisy, metadane i dostępność plików. A im więcej takich elementów trafia do otwartych baz, tym większa szansa, że zostaną później wchłonięte przez systemy AI.
AI widzi świat zupełnie inaczej niż my
Dla człowieka propaganda w obrazie bywa względnie łatwa do zauważenia. Widzimy kadrowanie, flagi, tłum, hasła, gesty polityków i ton opisu. Model AI działa inaczej. On nie ma intuicji historycznej ani moralnego odruchu sprzeciwu. On przetwarza dane, szuka wzorców i uczy się powiązań między obrazem, opisem, źródłem i kontekstem.
Modele sztucznej inteligencji coraz częściej działają multimodalnie – nie czytają już tylko tekstu, ale analizują też obrazy, nagrania i filmy. Jeśli takie repozytorium jest jednym z głównych źródeł otwartych danych, to kwestia tego, jakie pliki się tam znajdują i jak są opisane, przestaje być niszowym sporem wśród edytorów.
Pisaliśmy o tym w tekście: Wikipedia ma eksplozję ruchu. Zbadali sprawę i są przerażeni. Artykuły i zasoby Wikipedii należą do najważniejszych paliw dla modeli AI. To oznacza, że Wikipedia i Wikimedia nie są już tylko miejscem, do którego zaglądamy po odpowiedź. Stały się częścią układu trawiennego sztucznej inteligencji.
Rosja zrozumiała, że nie musi na siłę przekonywać ludzi
Dezinformacja nie musi już być pisana przede wszystkim dla ludzi. Dawniej celem propagandy było to, żeby użytkownik kliknął, przeczytał, uwierzył i podał dalej. Dziś równie ważnym odbiorcą jest crawler, czyli bot zbierający dane dla wyszukiwarki, modelu językowego albo systemu podsumowań.
Właśnie o tym pisaliśmy w tekście: Mój chatbot Władimir. Jak Rosjanie zatruwają wielkie modele językowe. Prawda tonie w morzu gorszych informacji, bo wyprodukowanie masowej nieprawdy jest tanie, szybkie i skalowalne. Jeżeli fałszywych lub zmanipulowanych treści powstaje wystarczająco dużo, zaczynają wyglądać jak część informacyjnego tła.
Przeczytaj także:
Sieć Pravda, znana też jako Portal Kombat, pokazała ten mechanizm bardzo wyraźnie. To ekosystem setek stron agregujących prorosyjskie treści, tłumaczonych automatycznie na wiele języków i kierowanych do odbiorców w różnych krajach. Badacze wykazywali, że linki z tej sieci pojawiały się w Wikipedii, w mediach społecznościowych i odpowiedziach chatbotów. To już nie jest zwykły portal propagandowy. To próba zatruwania źródeł, z których korzystają systemy uznawane później za neutralne.
*Grafika wprowadzająca wygenerowana przez AI
O nowych technologiach zaczął pisać jeszcze w 2012 r. na łamach portalu Telix. Później przez pewien czas pisał dla Komputer Świata i PCLabu. Epizod dziennikarski zaliczył także w lokalnej gazecie i w dziale blogowym SpeedTest. Współzałożyciel agencji BlueCopy, zajmującej się copywritingiem i poligrafią. Przez pewien czas właściciel firmy transportowej. Prywatnie fan starych polskich oper mydlanych (oglądanych obowiązkowo z konkubiną), dumny opiekun kotki brytyjskiej i pasjonat-amator druku 3D.