Dane są dziś prawdziwą walutą. Płyną w krwiobiegu sztucznej inteligencji

Dane stały się nową walutą. Są rodzajem środka płatniczego, którym płacimy za usługi.  

analiza danych

W pierwszych miesiącach roku świat usłyszał o aferze Cambridge Analytica. Niewielka firma za pomocą prostego quizu psychologicznego pozyskała informacje na temat kilkudziesięciu milionów kont na Facebooku. Co ciekawe, w samym quizie wzięło udział znacznie mniej użytkowników. U zarania skandalu mówiło się o 270 tys. Problem polegał na tym, że oprócz informacji o uczestnikach zabawy, Facebook pozwalał Cambridge Analytica (a także innym firmom) zbierać dane również ich znajomych.

Powyższy skandal doprowadził do wielu reperkusji. Szef Facebooka Mark Zuckerberg musiał tłumaczyć się przed podczas przesłuchania przed połączonymi komisjami i Parlamentem Europejskim. Jego serwis zapowiedział zmiany, mające na celu większą ochronę danych użytkowników. W ramach programu naprawczego zapowiedziano przegląd aplikacji, które miały dostęp do znacznych ilości informacji przed 2014 r., gdy Facebook go znacznie ograniczył. Aplikacje miały być również odcięte od danych, jeżeli użytkownik nie korzystał z nich dłużej niż 3 miesiące.

O Cambridge Analytica wspominam nieprzypadkowo. Afera ma bowiem pewien pozytywny wymiar. Wielu ludzi na świecie usłyszało o przetwarzaniu danych i sposobach ich pozyskiwania.

Dane użytkowników to nowy pieniądz.

Ktoś powiedział, że dane użytkowników są nową walutą. Choć nie jestem w stanie wskazać autora tego stwierdzenia, zgadzam się fundamentalnie z takim postawieniem sprawy. Dotąd często mówiliśmy o darmowych usługach. Facebook, Instagram, usługi Google - wielu z nas nazywa je bezpłatnymi, nie doceniając własnego wkładu. Owszem, za większość z nich nie zapłacimy nawet grosza, ale w zamian oferujemy usługodawcom sporą dawkę danych. To nasza waluta, którą opłacamy dostęp do wygodnych w użyciu rozwiązań.

Wyszukiwarka Google'a przetwarza średnio 40 tys. zapytań na sekundę. W każdej minucie trafia na Instagrama ponad 46 tys. zdjęć, na Twittera pół miliona tweetów, a na Facebooka ponad pół miliona komentarzy i blisko 300 tys. aktualizacji statusu. Każdego dnia wrzucamy na Facebooka ponad 300 mln zdjęć. To tylko kilka przykładów karmienia danymi. Udostępniamy znacznie więcej: lokalizację, preferencje zakupowe, informacje o naszym stylu życia - oglądanych filmach, czytanych książkach, spożywanych posiłkach, ulubionych restauracjach, podróżach itp.

Zazwyczaj nie przejmujemy się tym, jak wieloma informacjami dzielimy się w sieci i bagatelizujemy ich znaczenie. Nie jest jednak tak, że trafiają one w próżnię. Są przetwarzane i analizowane. Na ich podstawie otrzymujemy choćby rekomendacje zakupowe i wyświetlają się nam określone spersonalizowane reklamy.

W żyłach sztucznej inteligencji płyną dane.

Rzecz jasna kwestii pozyskiwania i analizowania danych nie należy spłycać do aktywności użytkowników internetu. Duże zbiory przetwarzane są przez naukowców. Na przykład do szukania planet pozasłonecznych. Dzięki zastosowaniu uczenia maszynowego i deep learning naukowcom we współpracy z Google udało się zidentyfikować planetę Kepler-90 i. Na początku nakarmiono sztuczną inteligencję 15 tys. sprawdzonych sygnałów tranzytu planet przez tarczę gwiazdy. Następnie poddano analizie słabsze sygnały pochodzące z 670 gwiazd. Odkryta planeta ma znajdować się 2500 lat świetlnych od Ziemi. Temperatura na powierzchni tego obiektu ma wynosić ponad 400 stopni Celsjusza, a okres jego obiegu wokół własnej gwiazdy 14,4 dnia.

Świetnym, a zarazem pozytywnym przykładem karmienia SI jest aplikacja ziBees, której celem jest wykrywanie pasożytów zagrażających pasiekom. W tym przypadku pszczelarz za pomocą aplikacji mobilnej dostarcza zdjęcia ramek ula. Te analizowane są przez algorytm pod kątem warrozy, choroby wywoływanej przez pajęczaki. W ogromnym uproszczeniu: im więcej zdjęć, czyli danych, tym algorytm będzie skuteczniejszy.

Analiza danych i ich przetwarzanie wymaga narzędzi i wiedzy.

Python to język, który nie tylko zyskał dużą popularność ze względu na niski próg wejścia, ale znalazł również zastosowanie w analizie danych i ich przetwarzaniu. Powstały wyspecjalizowane narzędzia wykorzystujące język do tych zagadnień. Jednym z nich jest biblioteka PANDAS, czyli Python and Data Analysis, której początki sięgają 2010 r.

Kurs Analiza danych w Python i PANDAS przeznaczony jest dla osób, które zdobyły już podstawową umiejętność programowania Pythonie i mają ogólną wiedzę o analizie danych. Uczestnicy szkolenia dowiedzą się jak importować, eksportować i przetwarzać dane, a także łączyć zbiory, filtrować, sortować i grupować dane. Nauka odbywać się będzie w darmowym Jupyter Notebook, który świetnie sprawdza się również do uczenia się podstaw Pythona. Twórca szkolenia zadbał o to, by kursanci mieli dostęp do plików potrzebnych przy rozwiązaniu zadań.

Autor kursu, Rafał Kraik, kieruje swoje szkolenie do analityków, wykorzystujących na co dzień inne narzędzia niż PANDAS oraz wszystkich tych, którzy chcą zajmować się zagadnieniami sztucznej inteligencji, data science i machine learning.

Kurs Analiza danych w Python i PANDAS dostępny jest za 34,99 zł. Jego autor przygotował również szkolenie Python dla początkujących, które może być wprowadzeniem do opisywanego kursu.

Artykuł powstał we współpracy z platformą Udemy

Najnowsze