REKLAMA

Czy polski język przetrwa? Walka o naszą kulturową suwerenność

Gdy premier Hiszpanii Pedro Sánchez zawierał polityczne układy z katalońskimi separatystami, obiecując im uznanie katalońskiego, baskijskiego i galicyjskiego za oficjalne języki Unii Europejskiej, prawdopodobnie nie myślał o tym, że jego ruch uruchomi dyskusję o cyfrowej suwerenności językowej całej Europy.

czy polski język przetrwa walka o kulturową suwerenność
REKLAMA

Zacznijmy od brutalnych faktów. Ponad połowa wszystkich stron internetowych działa w języku angielskim, mimo że tylko niecałe 5 proc. ludzi na świecie ma go jako język ojczysty. Dla porównania - chiński, którym posługuje się dwukrotnie więcej osób, stanowi zaledwie 1,4 proc. domen internetowych. To nie jest przypadek, to konsekwencja tego, jak działają algorytmy wyszukiwarek i platform społecznościowych.

Google'owski RankBrain, algorytm wykorzystujący sztuczną inteligencję do interpretowania zapytań, został wytrenowany głównie na angielskojęzycznych danych. Podobnie Meta AI, która właśnie wkracza do Polski, oferuje obsługę jedynie w sześciu europejskich językach - angielskim, francuskim, hiszpańskim, portugalskim, włoskim i niemieckim. Polski? Nie ma go na liście, mimo że jesteśmy szóstym co do wielkości krajem UE.

REKLAMA

To też jest ciekawe:

Paradoksalnie sam Google przyznaje, że około połowa użytkowników wyszukiwarki prowadzi wielojęzyczne wyszukiwania. System automatycznie określa, w jakim języku wyświetlić wyniki, ale algorytmy mają wyraźne preferencje - angielskojęzyczne treści są faworyzowane nawet wtedy, gdy użytkownik szuka po polsku.

Bruksela śpi, Warszawa milczy

Podczas gdy Hiszpanie walczą o swoje języki regionalne, polska dyplomacja wydaje się być w hibernacji cyfrowej. Rada do Spraw Ogólnych UE, która zajmuje się między innymi kwestiami struktury instytucjonalnej Unii, ma na stole hiszpański wniosek wymagający jednomyślności wszystkich 27 krajów. Belgia, Cypr, Portugalia, Holandia, Rumunia i Słowacja już wyraziły poparcie, ale Chorwacja, Czechy, Finlandia, Francja, Niemcy i Szwecja domagają się dalszego wyjaśnienia kosztów i skutków prawnych.

A Polska? Milczy jak zaklęta. Tymczasem moglibyśmy wykorzystać ten moment do postawienia fundamentalnego pytania: dlaczego w cyfrowej Europie niektóre języki są bardziej równe od innych?

Podobną bierność widać w implementacji Data Act - unijnego rozporządzenia, które od września będzie regulować dostęp do danych w gospodarce cyfrowej. Ministerstwo Cyfryzacji prowadzi konsultacje dotyczące wyznaczenia organów odpowiedzialnych za egzekwowanie aktu, ale gdzie są postulaty dotyczące zapewnienia językowej dostępności tych regulacji? Gdzie wymagania, by platformy cyfrowe działające w Polsce oferowały pełne wsparcie dla języka polskiego?

Data Act ma zapewnić sprawiedliwy dostęp do danych i ich wykorzystania między poszczególnymi uczestnikami rynku. Ale jak można mówić o sprawiedliwości, gdy algorytmy sztucznej inteligencji trenowane są głównie na angielskojęzycznych zbiorach danych, a potem oceniają jakość treści polskojęzycznych przez pryzmat anglosaskich standardów?

Netflix, Spotify i cyfrowa kolonizacja

Najlepiej widać to na przykładzie platform rozrywkowych. W Polsce dominują Netflix, Max (dawniej HBO Max), Spotify czy YouTube Music - wszystkie kontrolowane przez amerykańskich gigantów technologicznych. Polscy twórcy muszą dostosowywać się do algorytmów stworzonych w Dolinie Krzemowej, które preferują treści anglojęzyczne.

Spotify planuje wykorzystać technologię OpenAI do automatycznego tłumaczenia podcastów, zachowując ton głosu prowadzących. Brzmi rewolucyjnie, ale kto kontroluje jakość tych tłumaczeń? Czy algorytm wytrenowany głównie na angielskim zrozumie subtelności polskiego humoru, gry słów czy kulturowych odniesień?

Alternatywy jak Tidal, Deezer czy Apple Music to nadal zachodnie produkty z podobnymi ograniczeniami językowymi. Gdzie są polskie platformy streamingowe? TV Smart Go oferuje głównie polskie kanały telewizyjne, ale to kropla w morzu globalnej cyfrowej rozrywki.

Meta już ogłosiła, że jej AI będzie stopniowo rozszerzać ofertę w krajach Europy. Stopniowo to eufemizm oznaczający: gdy będzie nam się opłacało. Polski rynek, mimo 38 mln mieszkańców, najwyraźniej nie jest priorytetem.

Małe języki w czasach AI

Eksperci UNESCO ostrzegają: brak danego języka w sieci jest dla niego jak akt zgonu. W dobie sztucznej inteligencji proces ten może się dramatycznie przyspieszyć. Firmy trenujące modele AI pełnymi garściami czerpią z zasobów internetowych, traktując wszystko - od Dostojewskiego przez początkujących pisarzy po Zenka Martyniuka - jako zwykły content.

Gdy naukowcy z Centrum Sztucznej Inteligencji uniwersytetu w Hongkongu testowali ChatGPT, okazało się, że z indonezyjskiego na angielski tłumaczył poprawnie 28 z 30 zdań, ale w drugą stronę - tylko 19. Podobne dysproporcje dotyczą innych języków nieopartych na alfabecie łacińskim. A co z polskim, z naszymi przypadkami, trybami i wyjątkami gramatycznymi, które sprawiają, że nawet rodzimi użytkownicy czasem się gubią?

Co robić? Manifesty zamiast memów

Po pierwsze Polska powinna aktywnie włączyć się w dyskusję o językach w UE. Jeśli Hiszpania walczy o kataloński dla 7 mln użytkowników, to dlaczego my nie walczymy o polski dla 50 mln Polaków na świecie? Katalończycy już teraz mogą wysyłać zapytania do Parlamentu Europejskiego w swoim języku - od 2006 r. mają taką możliwość dzięki aktywnym działaniom swoich polityków.

Po drugie w implementacji Data Act powinniśmy wprowadzić wymagania językowe dla platform działających w Polsce. Jeśli amerykański gigant chce zbierać dane polskich użytkowników, niech zapewni pełne wsparcie dla polskiego języka - nie tylko w interfejsie, ale też w algorytmach rekomendacyjnych.

Po trzecie potrzebujemy inwestycji w polskie alternatywy cyfrowe. Nie mówię o budowaniu polskiego Facebooka - ten statek już odpłynął. Ale możemy stworzyć platformy zorientowane na polską kulturę, literaturę, muzykę. Inicjatywy jak Cohere for AI, która zaangażowała 3000 osób z 120 krajów do stworzenia modelu AI dla 101 języków pokazują, że się da.

Między Metallicą a Mickiewiczem

Hiszpania wydaje około 132 mln euro rocznie na tłumaczenie swoich trzech języków regionalnych na potrzeby UE. To koszt jednego odcinka serialu Netflixa. Ale dla Katalończyków, Basków i Galicyjczyków to inwestycja w tożsamość - sygnał, że jesteście częścią Europy.

REKLAMA

A my? Czy zgadzamy się na to, by polski język stal się cyfrowym skansenem, ciekawostką dla algorytmów trenowanych w Kalifornii? Czy pozwolimy, by nasze dzieci lepiej rozumiały angielskie memy niż polską poezję? Cyfrowa era nie musi oznaczać językowej kapitulacji. Ale wymaga cyfrowej odwagi i inwestycji w naszą językową suwerenność.

REKLAMA
Najnowsze
Aktualizacja: 2025-05-25T07:22:00+02:00
Aktualizacja: 2025-05-24T16:40:00+02:00
Aktualizacja: 2025-05-24T16:30:00+02:00
Aktualizacja: 2025-05-24T16:10:00+02:00
Aktualizacja: 2025-05-24T16:00:00+02:00
Aktualizacja: 2025-05-24T07:22:00+02:00
Aktualizacja: 2025-05-23T21:47:42+02:00
Aktualizacja: 2025-05-23T21:02:41+02:00
Aktualizacja: 2025-05-23T20:30:01+02:00
Aktualizacja: 2025-05-23T20:08:22+02:00
Aktualizacja: 2025-05-23T18:45:13+02:00
Aktualizacja: 2025-05-23T18:34:16+02:00
Aktualizacja: 2025-05-23T18:07:40+02:00
Aktualizacja: 2025-05-23T17:38:56+02:00
Aktualizacja: 2025-05-23T17:22:52+02:00
Aktualizacja: 2025-05-23T16:22:46+02:00
Aktualizacja: 2025-05-23T15:30:10+02:00
Aktualizacja: 2025-05-23T15:24:39+02:00
Aktualizacja: 2025-05-23T14:48:16+02:00
Aktualizacja: 2025-05-23T12:38:15+02:00
Aktualizacja: 2025-05-23T11:42:04+02:00
Aktualizacja: 2025-05-23T11:08:03+02:00
Aktualizacja: 2025-05-23T10:32:24+02:00
REKLAMA
REKLAMA
REKLAMA