Tech  / Felieton

Polska wyszukiwarka uporządkuje naszą część Internetu. Będzie lepsza od Google'a

Internet pod wieloma względami przypomina zburzoną bibliotekę – miejsce, gdzie znajduje się naprawdę wiele znaczących i bardzo ważnych informacji, ale znalezienie ich często graniczy z cudem. Dotyczy to zwłaszcza informacji w lokalnych językach, z których indeksowaniem nie najlepiej sobie radzą nawet produkty takie jak Google czy Bing. Ma się to zmienić dzięki wyszukiwarce Nekst, która ma uporządkować polską część Sieci.

A jest co porządkować, ponieważ w Internecie może znajdować się nawet miliard polskojęzycznych dokumentów. Obecnie wyszukiwarka dokładnie analizuje i porządkuje treści i… nigdy nie zakończy swojej pracy, bo tych cały czas przybywa. Jest to syzyfowa praca, ale z całą pracą mająca więcej sensu niż pchanie kamienia pod górkę ze świadomością, że ten zaraz i tak się stoczy. Jak na razie twórcom Nekst udało się zebrać 160 milionów polskojęzycznych dokumentów, co przekłada się na 16 procent tekstów dostępnych w polskim Internecie.

Oznacza to, że już zbliżają się do pułapu, który osiągnęły wyszukiwarki największych zachodnich firm. Ponieważ według kierownika projektu, profesora Jacka Koronackiego, dyrektora IPI PAN, wyszukiwarki mogą gromadzić zaledwie 20 procent polskich dokumentów. Ciekawostką jest, że wspomniane 160 milionów dokumentów zajmuje łącznie około 3 TB, czyli zmieściłyby się na dużym dysku twardym.

media-internetowe

Wyszukiwarka Nekst to rezultat pracy zespołu składającego się z ekspertów pochodzących z Instytutu Podstaw Informatyki PAN w Warszawie oraz Politechniki Wrocławskiej. Jeśli wszystko pójdzie zgodnie z ich planem, do czerwca tego roku zostanie przeskanowanych pół miliarda dokumentów, czyli blisko połowę danych znajdujących się w polskim Internecie. Po osiągnięciu tego pułapu wyszukiwarka  ma kontynuować swoją pracę, ale już w wersji dostępnej dla użytkowników.

Polska wyszukiwarka na tle swoich zagranicznych odpowiedników ma cechować się zupełnie innymi algorytmami naśladującymi mechanizm zrozumienia języka. Jest to spowodowane tym, że te same algorytmy muszą działać z zupełnie różnymi językami, cechującymi się odmiennymi zasadami działania. Z tego powodu Google czy Bing nie starają się nas zrozumieć i po prostu wyszukują podane przez nas frazy. Dobra, nieco Was okłamałem, w przypadku języka polskiego Bing nie robi nawet tego. W każdym razie Nekst jest pierwszą tak złożoną wyszukiwarką semantyczną.

internet ochrona prywatnosci

Unikalność algorytmów Nekst ma polegać na tym, że nie będzie ona szukać ciągu znaków, a analizować treść tekstów pod kątem najczęściej pojawiających się i najbardziej istotnych wyrażeń wielosłownych. Krótko mówiąc, będzie wiedziała, czego dotyczy dany tekst i do którego zapytania go przyporządkować. Dzięki temu o wiele lepiej sprawdzi się w naszym kraju niż Google przystosowany przede wszystkim do o wiele prostszego i pełnego zasad języka angielskiego. Produkt firmy z Mountain View nie może uwzględnić między innymi naszej fleksji oraz swobodnego szyku zdania.

Oznacza to, że będziemy mogli pytać o konkretne rzeczy i otrzymamy teksty najlepiej odpowiadające interesującemu nas tematowi. By wyświetlić lepiej odpowiadające nam wyniki, wyszukiwarka będzie mogła poprosić o doprecyzowanie hasła (pierś w końcu nie musi być z kurczaka!), pozwoli też na zadawanie pytań w sposób naturalny. Nekst ma też umożliwiać znajdywanie konkretnych fragmentów tekstów, w których znajdziemy odpowiedzi na interesujące nas pytania.  Z kolei w przyszłości możliwa będzie analiza emocjonalna zapytań (jakich informacji o kimś szukamy), analiza obrazów oraz o wiele więcej.

google prywatnosc

Szczerze kibicują projektowi, bo jestem przekonany, że może on mieć ogromny potencjał i kojarzy mi się z bardzo lubianą przeze mnie wyszukiwarką Wolphram Alpha. Działa ona w podobny sposób, tylko w języku angielskim. Za jej pomocą byłem w stanie znaleźć mnóstwo szczegółowych informacji oraz nauczyć się skomplikowani działań matematycznych, gdyż po wpisaniu równania wyświetla ona nie tylko wynik, ale kolejne kroki mówiące, jak się dotarło do rezultatu. Jeżeli jej polski odpowiednik będzie miał chociaż połowę funkcjonalności, z całą pewnością okaże się sukcesem, a już za kilka miesięcy Polacy będą używać nie jednej, a dwóch internetowych wyszukiwarek – Google oraz właśnie Nekst.

Zdjęcia The Polish flag button on the keyboard. close-uphand touching touch pad, social media concept, BATH, UK - MAY 4, 2011: Close-up of the Google.com search homepage displayed on a LCD computer screen with silhouette of a man's head out of focus in the foreground. pochodzą z Shutterstock. 

przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst