Co robią data scientiści i dlaczego analityka Big Data jest niezbędna do rozwoju biznesu w cyfrowych czasach
Informacja to najważniejsza waluta XXI wieku, ponieważ lepsza jej analiza i wykorzystanie przekłada się na wyższe zyski. Rozmawiamy z Patrykiem Chorosiem z SAS Polska o tym, jak firmy mogą budować swoją przewagę konkurencyjną na wiedzy ukrytej w danych.
Dla tych, którzy nie znają SAS Institute: to lider rynku zaawansowanej analityki i oprogramowania Business Intelligence. Innymi słowy, dzięki technologiom analitycznym SAS firmy mogą wyciągnąć z danych więcej informacji i oprzeć o nie swój sukces biznesowy. Kompleksowa wiedza o swoim biznesie i klientach, to ogromna przewaga biznesowa.
Z oprogramowania SAS korzysta 91 przedsiębiorstw z pierwszej setki rankingu Fortune 500. Sama firma istnieje od 1976 roku i zatrudnia na całym świecie 14 tys. pracowników. W Polsce SAS Institute działa od 1992 roku i posiada ponad 170 aktywnych klientów.
17 października, podczas dorocznej konferencji SAS Forum, firma zaprezentowała w Polsce swoją nową platformę technologiczną – SAS Viya
Nowa platforma zapewnia dużą otwartość na rozwiązania open source, takie jak np. Python i w najbliższej przyszłości R, a także pełną integrację z chmurą – publiczną, prywatną i hybrydową.
Co ciekawe SAS w swojej ofercie ma również linię narzędzi wizualnych, którą otwiera SAS Visual Analytics, dostępne zarówno dla MŚP, jak i wielkich korporacji, które można obsługiwać w bardzo przystępny i intuicyjny sposób, np. metodą drag&drop. Daje to nowe możliwości wykorzystania biznesowej analityki także przez użytkowników z działów biznesowych, które nie mają u siebie data scientysty.
Właśnie o tych tzw. „badaczach danych” miałem okazję porozmawiać z Patrykiem Chorosiem, Principal Business Solutions Manager w SAS Polska.
Karol Kopańko, Spider’s Web: O Big Data mówi się już od lat. Można wręcz odnieść wrażenie, że to branżowy „buzz word”. Jak w SAS rozumiecie Big Data?
Patryk Choroś, Principal Business Solutions Manager w SAS Polska: Big Data to cały ekosystem. Jako hasło Big Data pojawiło się jako nazwa transformacji, którą przeszliśmy w sposobie przetwarzania rosnącego wolumenu informacji.
To też zestaw funkcjonalności technologicznych, serwerów analitycznych i platform takich jak SAS Viya, połączonych z kompetencjami, które pozwalają wykorzystać wielkie zbiory danych.
Jak z Big Data korzystają wasi klienci?
Podam przykład InterCars – największego w Polsce dystrybutora części samochodowych i akcesoriów, który zbudował swoją przewagę konkurencyjną z wykorzystaniem analityki. Oni nie konkurują ceną, a dostępnością towaru. Analityk przewiduje ile i jakich części będzie potrzebne w każdej placówce, co pozwala na optymalną dystrybucję.
Analityków Big Data zwykło się teraz nazywać data scientistami. To obecnie jeden z najlepiej płatnych zawodów na świecie. Czym charakteryzuje się dobry data scientist?
Ciekawością w poszukiwaniu odpowiedzi.
Odpowiedzi na co?
Na pytania, które zadaje biznes. W każdym przypadku mogą być one inne, np. ile części potrzebuję mieć w tym i tym węźle sieci dystrybucyjnej, jak w przypadku InterCars.
Data scientiści to indywidualiści skoncentrowani na nowoczesnych metodach przetwarzania danych. Ich chęć do pracy wynika z tego, że robią coś inaczej albo robią coś metodą, której nikt jeszcze nie użył do rozwiązania takiego problemu.
Jednak, aby podjąć odpowiednią decyzję trzeba najpierw mieć odpowiednie dane. SAS dużo mówi o tzw. jakości danych – jak to rozumieć?
Kiedy podchodzimy do problemu analityki danych musimy sobie odpowiedzieć na pytanie: co to znaczy, że dane są dobre? Podręcznikowo najlepiej, aby były kompletne, spójne, poprawne, dostępne, zgodne czasowo i powszechnie jednoznaczne, co oznacza, że wszyscy tak samo rozumieją dane.
Czy zatem możemy uzyskać stopień poprawności zgromadzonych danych na poziomie 100 procent?
To jest mrzonka. Nie da się doprowadzić do sytuacji, kiedy będziemy mieli 100-procentową jakość danych. Oznaczałoby to, że mamy bardzo mało danych i jesteśmy je w stanie ręcznie oczyścić albo ponieśliśmy niewyobrażalne nakłady na zbieranie danych i zamykamy właśnie działalność.
Widziałem niedawno prezentację o przewrotnym tytule Where in the Lake is my Data [data lakes – koncepcja tzw. lakes, gdzie organizacje składowały swoje dane – przyp.red.], co kojarzy mi się z Where in the Sake is my Data [Gdzie na litość są moje dane –przyp.red].
Ludzie pakowali tyle danych do tych lakes, że data lakes zmieniały się w data swamps.
Zarządzanie jakością danych to doprowadzenie ich do poziomu, kiedy możemy im zaufać, co też jest względne. W kontrolingu finansowym powiedzą, że wszystko musi się zgadzać, dane to apteka. Inaczej jest w marketingu: „te 3 proc., o których Pan mówił, że może ich nie być, bo mnie nawet nie interesują, bo podejmuję decyzje na poziomie makro”.
A czy moglibyśmy oddać analizę Big Data robotom?
To przyszłość, ale obecnie jest to praktycznie niemożliwe, aby w pełni powierzyć maszynom zarządzanie złożonym biznesem.
Już teraz staramy się implementować algorytmy w niektórych urządzeniach. Weźmy np. taką żarówkę - w przyszłości, niedługo przed przepaleniem będzie ona sygnalizowała, swój stan mruganiem, aby technik mógł szybko ją wymienić i na koniec zniwelować czas bez oświetlenia.
Podobne procesy implementujemy też np. na stacjach wiertniczych. Wówczas możemy optymalnie zaplanować serwis, przegląd i uniknąć nieplanowanych przestojów.
Czyli pośrednio każdy z nas czerpie korzyści z analityki Big Data?
Oczywiście – analityka wielkich zbiorów danych weszła na stałe do życia codziennego. I to zarówno pośrednio, jak i bezpośrednio. Bez Big Data nie byłoby takiego przemysłu, z jakim dziś mamy do czynienia. To ona pozwala efektywnie wydobywać surowce, przetwarzać je, produkować energię elektryczną, czy też projektować nowe usługi i produkty.
Może nie każdy zdaje sobie z tego sprawę, ale np. samochody są projektowane i, co jest nowością, także serwisowane oraz monitorowane, z wykorzystaniem analityki. Ta inteligencja weszła na stałe do cyklu innowacyjnego – od koncepcji po inteligentny i zupełnie nowy produkt. Stamtąd przebija się już bezpośrednio do nas, do użytkowników. Kiedy korzystamy z inteligentnych urządzeń, to właśnie sięgamy po analitykę Big Data, która podpowiada nam jak jeszcze łatwiej i wydajniej z nich korzystać.
A co z innymi obszarami życia? Czy Big Data wpływa też na usługi?
Od dawna. Projekty i wdrożenia, które realizujemy dla sektora finansowego czy telekomunikacyjnego zmieniają ich sposób działania. Banki są w stanie lepiej zarządzać ryzykiem finansowym, ale też optymalnie kierować do nas swoją ofertę.
Dzięki analityce Big Data nie jesteśmy już spamowani natrętnymi reklamami lokat – każdy komunikat, każda oferta, jest skrojona na miarę i osadzona w kontekście naszych potrzeb. To powoduje, że korzystanie z nowoczesnych usług, takich jak bankowość elektroniczna, jest wygodne i intuicyjne. Zupełnie, jakbyśmy posiadali własnego asystenta pomagającego nam podejmować właściwe decyzje.
Tylko że te decyzje są sprofilowane dokładnie pod potrzeby i cele banku, a nie nasze osobiste?
Niekoniecznie, bo my także jesteśmy zupełnie innym typem konsumenta. Przede wszystkim umiemy krytycznie oceniać lub porównywać otrzymywane oferty i dzięki temu świadomie podejmować decyzje zakupowe. Naciskanie na zakup niepotrzebnych nam lub niekorzystnych dla nas produktów będzie powodował przejście do innego banku, telekomu lub innego dostawcy usług.
Big Data pozwala firmom budować lojalność klientów, unikać wycofywania zgód na komunikację marketingową, a co najważniejsze w naszych czasach, umiejętne wykorzystywać część prywatności, z której rezygnujemy. Za każdym razem, kiedy nasze dane są szczegółowo analizowane, profilowane, w pewnym sensie może to być postrzegane jako naruszanie naszej prywatności.
Poza ochroną tego obszaru przez odpowiednie instytucje i regulacje prawne , należy pamiętać, że dostawcy usług też to rozumieją i dbają o właściwe wykorzystanie tych informacji z naciskiem na budowanie wartości dodanej dla swoich klientów. Big Data otworzyło nową przestrzeń do budowania przewag konkurencyjnych poprzez uzyskanie umiejętności wyprzedzania potrzeb klientów.