REKLAMA

A gdyby Wikipedię zamienić w mapę?

O tym, że Wikipedia to fenomen pokazujący możliwości, jakie daje internet nikogo nie trzeba przekonywać. Jej zasoby wciąż są powiększane i dopracowywane. Nawet w Polsce pojawiają się pomysły, by zastąpić pisanie prac licencjackich opracowywaniem haseł właśnie dla Wikipedii. Duża część artykułów w tej internetowej encyklopedii odnosi się do konkretnych miejsc na świecie. Olivier H. Beauchesne chce wykorzystać ten fakt i poświęcić kilka dni ze swojego życia, by w formie graficznej przedstawić strukturę geolokalizacji haseł tej internetowej encyklopedii.

wikipedia
REKLAMA
REKLAMA

Na serwerach Wikipedii znajduje się 1,5 miliona haseł opracowanych przez internautów, z czego około 400 tysięcy jest geolokalowanych. Pierwszą rzeczą, jaką zrobił Beauchesne było pobranie surowych danych, które „ważą” aż 40 GB w formie nieskompresowanej. Wyzwaniem, jakie napotkał twórca tego projektu była kategoryzacja uzyskanych w ten sposób wpisów w odpowiednie kategorie tematyczne. W tym celu użył algorytmu Latent Dirichlet Allocation (LDA), który w przeciągu 50 godzin pracy, wyodrębnił 300 różnych kategorii tematycznych, w oparciu o które powstały poniżej prezentowane mapy. Utworzone w ten sposób bardzo zróżnicowane kategorie zostały naniesione na mapę świata. Niektóre mapy, a tym samym kategorie odnoszą się do sportu, nauki, grup etnicznych czy też muzyki. Pełny ich spis wraz z hasłami kluczowymi można znaleźć tutaj. Natomiast archiwum zawierające wszystkie mapy można znaleźć tutaj (900 MB).

REKLAMA

Choć gdy czyta się relację Beauchesne z prac, jakie prowadził nad tym projektem, to można by się spodziewać czegoś więcej, to jednak jego dzieło zrobi wrażenie na zwykłym użytkowniku Wikipedii. Co prawda jako jeden z przykładów wykorzystania uzyskanych danych w praktyce autor pokazuje aspekt etniczności oraz tego jak kształtowały się państwowość danych krajów oraz jakie odzwierciedlenie na obecną sytuację ma przeszłość kolonialna niektórych krajów, jednak czy faktycznie będzie interesowało Nowaka szukającego np. informacji o Ankarze? Raczej nie. Projekt jest jednak bardziej pokazaniem możliwości, jakie daje Wikipedia jako baza danych oraz narzędzia analityczne, z których mogą korzystać współcześni badacze.

Nie można jednak pomijać nakładu pracy poniesionego na ten projekt, ale czy naprawdę mówi on nam coś więcej na temat samej Wikipedii? Raczej niewiele nowego się dowiemy, prócz truizmu, że jest to chyba najlepszy przykład na to, jak można tworzyć globalny projekt, w który angażują się ludzie z całego świata, niie będący bynajmniej kolejną zbiórka na Kickstarterze, tylko nowoczesna encyklopedia na miarę XXI wieku i popularyzacji powszechnego dostępu do internetu i źródeł elektronicznych. Ikoną takich zmian w dostępie do wiedzy jest przecież m.in. fakt, że Encyklopedia Britannica przestała ukazywać się w wersji papierowej na rzecz cyfrowej. Jak widać Wikipedia i w niej zawarte artykuły skrywają jeszcze wiele ciekawych danych, które mogą powiedzieć nam więcej na temat społeczności tworzącą encyklopedię oraz o tym, co budzi największe zainteresowanie internautów. Projekt Oliviera H. Beauchesne w doskonały sposób pokazuje jaki wpływ na rozwój Wikipedii mają lokalne wydarzenia oraz specyfika danych krajów oraz ich mieszkańców. Warto się temu bliżej przyjrzeć.

REKLAMA
Najnowsze
REKLAMA
REKLAMA
REKLAMA