REKLAMA

Google stworzył AI do komunikacji z robotami. Przerażeni?

Mamy AI do tłumaczenia tekstów, mamy AI do pisania tekstów, AI do tworzenia obrazów, muzyki, wideo..., a teraz także do komunikacji z robotami. Nowy model sztucznej inteligencji Google stawia most pomiędzy zaawansowanymi maszynami a zwykłymi ludźmi znającymi jedynie język naturalny. Dzięki czemu komunikacja nawet bardziej złożonych zadań sprowadzi się do mówienia do robota, jak do dziecka.

Google stworzył AI do komunikacji z robotami. Przerażeni?
REKLAMA

Choć tworzymy roboty na własne podobieństwo i staramy się, by tak w wyglądzie, jak i zachowaniu nie odstawały od ludzi. Jednak istnieje pewna kwestia, która spędza inżynierom i programistom sen z powiek - język. Nie chodzi o język naturalny, bowiem ten z łatwością można dać robotowi za pomocą dużych modeli językowych. Przypomnijmy, że ChatGPT udało się uruchomić na robo-psie produkowanym przez Boston Dynamics.

Chodzi o kwestie programistyczne, tak by robot był w stanie chodzić, podnosić kończyny, chwytać i wchodzić w fizyczne reakcje z rzeczywistością, która jest niezwykle barwna, dynamiczna i zmienna. W lutym bieżącego roku Microsoft zaadresował ten problem wróżąc, że ChatGPT będzie nie tylko rozwiązywał matury, ale i będzie stanowił pomost komunikacyjny pomiędzy inżynierami robotyki a maszynami. Teraz podobny plan ma Google.

REKLAMA

Był tłumacz Google dla ludzi, teraz jest tłumacz Google dla robotów. Model sztucznej inteligencji RT-2 uprości komunikację z robotami

Jak poinformował Google na swoim blogu, zespół koncernu zajmujący się AI, Google DeepMind, oficjalnie zaprezentował Robotics Transformer 2 - w skrócie RT-2. RT-2 jest nowym modelem AI typu wizja-język-działanie (vision-language-action, VLA), którego dane treningowe pochodzą zarówno z internetu (dzięki czemu model potrafi rozpoznawać wzorce językowe i wizualne), jak i zbiorów danych wiedzy z zakresu robotyki. Dzięki temu AI jest w stanie przetłumaczyć instrukcje z języka ludzkiego na instrukcje działania zrozumiałe dla robota.

Numer 2 jest nieprzypadkowy w nazwie robota, gdyż jest on drugą inkarnacją modelu Robotic Transformer (RT-1), zaprezentowanego zaledwie 7 miesięcy temu. Model sztucznej inteligencji RT-1 został wytrenowany na danych pochodzących z różnego rodzaju zadań i jest w stanie na ich podstawie uczyć się kombinacji różnych zadań i obiektów z nimi związanych.

W danych treningowych RT-2 zawarto dane pochodzące z 13 robotów, które przez 17 miesięcy korzystały z modelu RT-1 do wykonywania poleceń w kuchni znajdującej się w kuchni jednego z biur Google. RT-2 czerpie także garściami z modelu PaLM-E, multimodalnego modelu językowego Google, który pozwala na przetwarzanie wizualnych informacji (np. znaków strzałek czy ostrzeżeń) na informacje zrozumiałe dla robota.

Jak działa RT-2?

W 26 stronicowym artykule opisującym działanie modelu naukowcy Google zaprezentowali działanie AI, która całkiem sprawnie tłumaczy robotowi różne polecenia, takie jak np. "włóż truskawkę do odpowiedniej miski", "przenieś piłkę do piłki nożnej obok piłki do gry w koszykówkę" czy "przenieś banana do Niemiec" - w ostatnim przykładzie kraje były reprezentowane jedynie przez flagi.

Jak piszą badacze, RT-2 wykazuje zwiększenie skuteczności (w porównaniu do RT-1) w każdym z postawionych mu zadań: rozpoznawaniu symboli, rozumowaniu i rozpoznawaniu ludzi.

REKLAMA

Ponadto RT-2 wykazywał zwiększoną skuteczność w dostosowywaniu się do nowych, nieznanych mu sytuacji takich jak prezentacja nowych obiektów, teł i miejsc - 62 proc. poprawnie wykonanych zadań w porównaniu do 32 proc. skuteczności RT-1.

REKLAMA
Najnowsze
REKLAMA
REKLAMA
REKLAMA