Pokazujesz mu obiekt, a on o nim opowie. Nowa wersja bota Google'a wytłumaczy ci świat
Gigant technologiczny odpowiedzialny za najpopularniejszą wyszukiwarkę i przeglądarkę internetową pokazał nową wersję asystenta Gemini 2.0.
Pierwszy model językowy z serii Gemini 2.0 to 2.0 Flash. Według producenta ma cechować się nie tylko lepszą wydajnością, niższymi opóźnieniami względem dotychczasowego modelu 1.5 Flash. Ale też i nowymi funkcjami – Gemini będzie umieć także tworzyć obrazy, dźwięk, a nawet… zrozumie, co się dzieje na naszym ekranie podczas grania.
Google Gemini 2.0 potrafi wiele. Zbyt wiele
Nowa wersja asystenta Google’a ma wprowadzać także ulepszenia w zakresie multimodalności – czyli obsługi danych wyciąganych z różnych, często związanych ze sobą źródeł – tekstu, obrazu, dźwięku, wideo. Google w komunikacie dotyczącym Gemini 2.0 mówi również o lepszym przetwarzaniu długich, skomplikowanych kontekstów.
Świeżo wydane oprogramowanie nie jest dostępne wyłącznie dla deweloperów i najbardziej zaawansowanych użytkowników za sprawą narzędzi takich jak Google AI Studio czy Vertex AI. Także i zwykli użytkownicy asystenta Gemini mogą skorzystać z najnowszej wersji 2.0 Flash w formie czatu, uruchamiając stronę internetową Gemini na komputerze, laptopie lub smartfonie. Według Google odświeżone wydanie asystenta niebawem pojawi się w aplikacji mobilnej Gemini.
Gemini 2.0 Flash przyniesie nie tylko bardziej adekwatne, celniejsze odpowiedzi na pytania zadane przez użytkownika, ale też ulepszenia narzędzi, które wyglądają jak usługi z przyszłości – Projektu Astra oraz Projektu Mariner. Pierwszy z nich stanowi usługę umożliwiającą rozumienie świata rzeczywistego - ma funkcję identyfikowania obiektów, dźwięków i wyciągania innych informacji z obrazu widzianego przez obiektyw telefonu lub innego urządzenia w czasie rzeczywistym.
Gemini 2.0 wprowadza szereg ulepszeń do Projektu Astra – rozumienie większej liczby języków, akcentów, nietypowych słów oraz obsługę narzędzi typu wyszukiwarka Google, Mapy Google, Obiektyw Google. Model językowy ulepsza kwestię zapamiętywania informacji, dzięki czemu asystent pamięta m.in. rozmowy przeprowadzone z użytkownikiem, które odbyły się do 10 minut wstecz.
Project Mariner to natomiast narzędzie stworzone dzięki Gemini 2.0. Usługa będzie dostępna jako rozszerzenie dla przeglądarki Chrome. Oprogramowanie w wielkim skrócie ma rozumieć wszystko, co się dzieje na ekranie komputera. Informacje zebrane z przeglądarki mają służyć do wykonywania określonych zadań, które zleci użytkownik – m.in. umożliwi na poruszanie się po przeglądarce, pisanie, klikanie w aktywnych kartach, a nawet wykonywanie zakupów - ale tylko po uzyskaniu zgody użytkownika.
To jednak nie wszystko. Google stworzył agenta sztucznej inteligencji na podstawie Gemini 2.0, który umożliwia wykonywanie czynności w grach wideo. Gigant technologiczny przekazał, że narzędzie we wczesnej fazie potrafi wyciągać wnioski na temat gry i sugerować użytkownikowi co ma robić w czasie rzeczywistym.
Wydanie oznaczone numerem 2.0 zostanie wprowadzone również do funkcji podsumowania AI w wyszukiwarce Google, które jest obecnie dostępne dla miliarda użytkowników w wielu regionach. W Polsce i Europie jeszcze nie możemy skorzystać z tej opcji, ale gigant pochwalił się, że w ciągu następnego roku podsumowania AI mają zostać udostępnione na nowych rynkach. Czy Unia Europejska będzie jednym z nich? Zobaczymy.
Więcej o sztucznej inteligencji przeczytasz na Spider's Web: