Sztuczna inteligencja i interaktywni asystenci. Taką wizję przyszłości nakreślił nam Amazon
Gdańsk na miejsce konferencji Innovation@Amazon wybrano nieprzypadkowo. To właśnie tutaj mieści się Amazon Development Center, czyli polski oddział badań i rozwoju Amazon.
Polski oddział w ostatnich dwóch latach rozrósł się do 300 osób, z czego ponad 100 to inżynierowie tworzący oprogramowanie, a reszta zatrudnionych to pracownicy wspierające operacje Amazon, głównie związane z niemieckim rynkiem i obsługą interakcji z Alexa. Ruhi Sarikaya w trakcie rozmowy określił polski oddział jako „największy amazonowy success story”.
Innovation@Amazon przeznaczona jest głównie dla inżynierów zainteresowanych technologiami Amazon, pragnących dowiedzieć się więcej o możliwości ich wykorzystania. Po spędzeniu dnia w gdańskim Starym Maneżu, w którym odbyła się konferencja nietrudno spostrzec, że najważniejszym dla Amazon tematem jest Alexa i interakcje ze sztuczną inteligencją.
Alexa w każdym domu i samochodzie
Alexa to już nie jedno urządzenie - to inteligentny asystent Amazon, który jest uaktywniony w wielu urządzeniach. Składa się z wielu współpracujących ze sobą komponentów. Tak naprawdę cała złożoność obliczeniowa jest umieszczona w chmurze. Ruhi Sarikaya, pierwszy z prelegentów w trakcie swojej prezentacji określił ją wręcz jako pudełko z głośnikiem. Cała funkcjonalność kryje się w chmurze Amazon.
Prezentacja Ruhiego wyjaśniała w jaki sposób Alexa odpowiada na pytania użytkownika i w jaki sposób twórcy aplikacji mogą rozwijać jej umiejętności. Architektura jest przemyślana - napisać nową umiejętność (ang. Alexa Skill) dla amazonowego asystenta jest bardzo łatwo. Programista nie musi się zajmować ani rozpoznawaniem mowy, ani jej syntezą - otrzymuje gotową „rozpracowaną” wypowiedź użytkownika. Wystarczy, że wygeneruje dla niej odpowiedź i zwróci systemowi - a ten zajmie się przekazaniem go w preferowanej postaci użytkownikowi.
Pojedynczy „skill” - umiejętność może odpowiadać za prognozę pogody, uruchomienie odtwarzania muzyki czy analizę wiedzy. Może podpowiadać podobne filmy lub najlepsze kierunki wakacyjne po podaniu preferencji przez użytkownika. Może podpowiedzieć przepisy na podstawie tego, co mamy w lodówce, lub rozpocząć grę słowną z użytkownikiem. Możliwości są ograniczone jedynie wyobraźnią programistów. Nic dziwnego, że na rynku jest w tej chwili opublikowanych ponad 25 tysięcy umiejętności Alexa, napisanych przez niezależnych twórców aplikacji.
Zrozumieć człowieka
Sarikaya nakreślił największe wyzwania związane z interakcją z Alexa jakie Amazon widzi przed sobą w przyszłości. Jednym z nich to wykrywanie kontekstu (ang. contextual carryover). Inteligentny asystent powinien potrafić z wcześniejszych wypowiedzi użytkownika określić bliżej, o co mu chodzi. Co może oznaczać „Alexa, znajdź mi Igrzyska śmierci”? Film, książkę, czy audiobooka? A może o jeszcze coś innego? Podobnie „Co możemy zrobić na kolację?” może oznaczać pytanie o przepisy (jeśli użytkownik lubi gotować), lub o dostawę jedzenia albo rezerwację stolika w restauracji. Wszystko zależy od poprzednich interakcji z tym użytkownikiem.
Komputery jak w Star Treku
W swoim słynnym eseju (który był jego pożegnalnym artykułem) Walt Mossberg napisał o znikającym komputerze i nadchodzącej erze ambient computing. Tak naprawdę przestaniemy się zastanawiać, które konkretnie urządzenie spełniło nasze polecenie, mówiąc „zapal światła, zmniejsz temperaturę i odtwórz moją ulubioną płytę w salonie”. Alexa jest właśnie jednym z systemów, które to umożliwią. Użycie Alexa jest analizowane, szczególnie pod kątem problemów - sytuacji kiedy urządzenie nie zrozumiało naszej intencji. Każdy taki przypadek jest odsłuchiwany przez specjalistę (często native speakera), który pomoże stworzyć odpowiednie reguły, umożliwiające zrozumienie użytkownika w przyszłości.
Przyczyny nieporozumienia mogą być różne. Być może osoba, która rozmawiała z Alexa, użyła skrótu myślowego, wyrażenia slangowego lub miała wadę wymowy. A może po prostu sama słabo znała język, którego używała? Każda taka sytuacja jest zanalizowana i opisana. Przyczynia się to do ciągłego zwiększenia jakości usług Alexa.
Rozmowa z Maxem Amordeluso
W trakcie trwania konferencji miałem okazję porozmawiać z Maxem Amordeluso, menadżerem zespołu zajmującego się Alexa Skills Kit. To właśnie dzięki tej usłudze programiści na całym świecie mogą budować nowe umiejętności Alexa, a właściciele istniejących usług mogą zaprezentować swoim użytkownikom zupełnie nowe możliwości interakcji. Uber zamawiany za pomocą aplikacji, i za pomocą rozmowy z Alexa to zupełnie inne doświadczenia! I właśnie na stronie dostawcy usług postanowiłem skupić się w rozmowie z Maxem.
Spider’s Web: Alexa Skills Kit to otwarta na wszystkie technologie usługa, która ułatwia pisanie nowych umiejętności Alexa. Ciekaw jestem, jak oceniasz jej wdrażanie wśród programistów?
Max Amordeluso: Moim zdaniem wdrażanie idzie doskonale. W tej chwili mamy ponad 25 tysięcy dodatkowych umiejętności opublikowanych przez niezależnych programistów. Są one aktywowane na milionach urządzeń, ale należy pamiętać, że nie każda zbudowana umiejętność jest publikowana. Programiści często tworzą je na własny, lub wewnętrzny użytek.
Spider’s Web: To czego potrzebuję, żeby zacząć pisać za pomocą Alexa Skills Kit?
Max Amordeluso: Dziękuję za to pytanie, bo z tym radzimy sobie doskonale. Wystarczy wejść na stronę Alex Skills Kit, i zobaczyć, jak zbudować nowy skill dosłownie w pięć minut. Mamy też mnóstwo dobrych przykładów i szablonów dzięki którym możesz od razu zacząć pracę. Ostatnio zaobserwowaliśmy też swoisty efekt domina - zaczyna się tworzyć społeczność, która zaczyna dostarczać materiałów do nauki.
Spider’s Web: Czy musimy dokupić jeszcze jakiś sprzęt, żeby zacząć?
Max Amordeluso: Jeśli za jakiegoś powodu nie chcesz lub nie możesz zainwestować w sprzęt z Alexa, możesz użyć specjalnie przygotowanej w tym celu strony echosim.io Możemy się tam zalogować, przesłać nasze zaprogramowane skille, uaktywnić co chcemy i używać jak Alexa. Dodatkowo mamy wgląd w kod i dane, które są przesyłane w formie JSON. (Można również urządzenie z Alexa samemu sobie zbudować mając Raspberry Pi – SW)
Spider’s Web: Możesz podać przykłady niesamowitych rzeczy stworzonych przez niezależnych developerów?
Max Amordeluso: Jestem w głębi serca graczem, więc bardzo podobają mi się gry stworzone dla asystenta Alexa. Gdy jadę samochodem, lubię grać w grę o tytule Yes Sire, w której jesteś królem podejmującym decyzje na temat swojego królestwa. Jest to też przykład gry, w którą można grać po ciemku, choć przed snem wolę uruchomić relaksujące dźwięki generowane przez Alexa.
Wizja przyszłości według Amazon
W trakcie konferencji można było dowiedzieć się sporo o wewnętrznym działaniu największej firmy świata. Na przykład tego, że nowe projekty powstają w oparciu o jak najkrótszy dokument opisujących ich działanie w formie informacji prasowej. Czyli bez szczegółów technologicznych, tylko z informacjami ważnymi dla klienta. Wiąże się to z kulturą Amazon którą jedną z zasad jest stawianie klienta na pierwszym miejscu.
Zapoznałem się również z faktem, że optymalny zespół to według metod zarządzania Amazon taki, który naje się dwiema pizzami (czyli ja sam byłbym optymalnym zespołem w Amazon). Albo kolejna informacja - podana jako ciekawostka - że Amazon ma w użyciu więcej robotów, niż cała armia Stanów Zjednoczonych. Jednak to właśnie zagadnienia związane z interakcjami z wirtualnymi asystentami oraz rozwojem sztucznej inteligencji wysuwały się na pierwszy plan, jako najbardziej interesujące dla firmy i wyznaczające kierunek jej rozwoju.
*Materiał powstał przy współpracy z firmą Amazon