Wiemy, jak myśli sztuczna inteligencja? Przełomowe badanie
Naukowcy opracowali nową metodę wizualizacji tego jak "myśli" AI. Dzięki metodzie dystrybucji k* mają nadzieję zrewolucjonizować wszystkie dziedziny, gdzie rozebranie AI na części pierwsze jest kluczowe dla bezpieczeństwa i dobrobytu ludzi.
Uczenie się na przykładach jest jednym z najpotężniejszych i najbardziej tajemniczych mechanizmów napędzających inteligencję - niezależnie od tego, czy mówimy o ludziach, czy o maszynach. Prosty przykład: dzieci i nauka nazw zwierząt. Wystarczy pokazać im wystarczająco dużo przykładów tego jak wygląda kot i tego jak wygląda koń, by mogły one nazwać zwierzę niezależnie od tego czy patrzą na ilustrację pstrokatego kota, czy zdjęcie czarnego konia.
Nadal nie wiemy, w jaki sposób myśli AI. Nowa metoda może doprowadzić do przełomu
Podstawowa teoria głosi, że mózg jest maszyną do odnajdywania wzorców. Kiedy pokaże mu się wystarczająco dużo przykładów, zacznie wyróżniać pewne cechy wizualne wyróżniające koty lub konie od innych zwierząt, a te ostatecznie łączone są w protokoły decyzyjne, które dają nam zdolność do automatycznego i nieświadomego kategoryzowania nowych doświadczeń.
Trochę paradoksalnie, ale ludziom wciąż przychodzi łatwiej nauczenie się nowych wzorców - niezależnie czy mówimy o odróżnieniu żyrafy od słonia czy matematyce - niż wyjaśnienie jak właściwie mózg tworzy te wzorce. A ponieważ systemy sztucznej inteligencji wzorowane są na działaniu ludzkiego umysłu, inżynierowie i naukowcy wciąż nie są w stanie odpowiedzieć na pytanie jak właściwie uczy się sztuczna inteligencja.
Odpowiedź na to pytanie mogą mieć jednak naukowcy z japońskiego Uniwersytetu Kyushu, którzy opracowali nową metodę wizualizacji pozwalającą zrozumieć, w jaki sposób głębokie sieci neuronowe interpretują i kategoryzują nowo przyswojone informacje. Metodę naukowcy opisali na łamach czasopisma IEEE Transactions on Neural Networks and Learning Systems.
Przetwarzanie informacji przez głębokie sieci neuronowe jest procesem złożonym i przede wszystkim, wieolopoziomowym - podobnie jak w przypadku ludzi, gdy rozwiązujemy zagadki czy zadania matematyczne.
Na pierwszym poziomie głębokie sieci neuronowe zapoznają się z informacjami. Kolejne poziomy, zwane przez naukowców "warstwami ukrytymi", to przede wszystkim analiza informacji pozyskanych na poziomie pierwszym. Wczesne warstwy ukryte koncentrują się na podstawowych cechach informacji.
Można je porównać do układania puzzli, gdzie pobieżnie zapoznajemy się z krawędziami i ogólnymi kolorami, bez zagłębiania się w detale poszczególnych kawałków. Na "najgłębszych" poziomach warstw ukrytych sieci neuronowe wykorzystują wszystkie zdobyte informacje, by dać pożądany efekt - podobnie jak my po zapoznaniu się z puzzlami i posiadając wiedzę dotyczącą specyfiki różnych obiektów i innych kontekstów układamy cały obrazek z puzzli.
"Jednak te ukryte warstwy są jak zamknięta czarna skrzynka: widzimy dane wejściowe i wyjściowe, ale to, co dzieje się wewnątrz, nie jest jasne. Ten brak przejrzystości staje się poważnym problemem, gdy sztuczna inteligencja popełnia błędy, czasami wywołane przez coś tak małego, jak zmiana pojedynczego piksela. Sztuczna inteligencja może wydawać się inteligentna, ale zrozumienie, w jaki sposób podejmuje decyzje, jest kluczem do zapewnienia, że jest godna zaufania"
- mówi Danilo Vasconcellos Vargas, profesor nadzwyczajny z Wydziału Informatyki i Inżynierii Elektrycznej na Uniwersytecie Kyushu.
Wobec czego naukowcy opracowali nową metodę wizualizacji informacji, którą nazwali "metodą dystrybucji k*". Model wizualizacji działa poprzez przypisanie każdemu wprowadzonemu punktowi danych „wartości k*”, która wskazuje odległość do najbliższego niepowiązanego punktu danych. Wysoka wartość k* oznacza, że punkt danych jest dobrze oddzielony (np. kot daleko od psów), podczas gdy niska wartość k* sugeruje potencjalne nakładanie się (np. pies bliżej kota niż innych kotów). Patrząc na wszystkie punkty danych w obrębie klasy danych, takiej jak koty ilustracje kotów, podejście to tworzy rozkład wartości k*, który zapewnia szczegółowy obraz organizacji danych.
Może zainteresować cię także:
Korzystając z tej metody, naukowcy pokazali, że głębokie sieci neuronowe sortują dane w skupiskach, częściowo podzielonych lub nakładających się układach. W układzie skupionym podobne elementy (np. koty) są zgrupowane blisko siebie, podczas gdy niepowiązane elementy (np. psy) są wyraźnie oddzielone, co pokazuje, że sztuczna inteligencja jest w stanie dobrze sortować dane. Podzielone układy wskazują, że podobne elementy są rozproszone na dużej przestrzeni, podczas gdy nakładające się rozkłady występują, gdy niepowiązane elementy znajdują się w tej samej przestrzeni, przy czym oba układy zwiększają prawdopodobieństwo błędów klasyfikacji.
Te układy Vargas porównał do magazynów, gdzie podobne przedmioty ułożone są blisko siebie. Jednak w przypadku wymieszania - przypadkowego lub wynikającego z braku miejsca - tworzy się chaos i łatwo o pomyłkę.
Według naukowców metoda dystrybucji k* pomaga badaczom, prawodawcom, twórcom oprogramowania oraz innym jednostkom wykorzystującym AI ocenić, w jaki sposób sztuczna inteligencja organizuje i klasyfikuje informacje, wskazując potencjalne słabości lub błędy. Ma to wspierać zarówno procesy legalizacji potrzebne do bezpiecznego włączenia sztucznej inteligencji do codziennego życia, ale także zapewnić cenny wgląd w to, jak AI "myśli".
Identyfikując podstawowe przyczyny błędów, naukowcy będą mogli być w stanie udoskonalić systemy sztucznej inteligencji, aby były nie tylko dokładne, ale także solidne - zdolne do obsługi rozmytych lub niekompletnych danych i dostosowywania się do nieoczekiwanych warunków.
"Naszym ostatecznym celem jest stworzenie systemów sztucznej inteligencji, które zachowają precyzję i niezawodność, nawet w obliczu wyzwań związanych z rzeczywistymi scenariuszami"
- podsumowuje Vargas.