Pokazujesz mu obiekt, a on o nim opowie. Nowa wersja bota Google'a wytłumaczy ci świat

Gigant technologiczny odpowiedzialny za najpopularniejszą wyszukiwarkę i przeglądarkę internetową pokazał nową wersję asystenta Gemini 2.0.

Albert Żurek

11.12.2024 19:01

Pokazujesz mu obiekt, a on o nim opowie. Nowa wersja bota Google'a wytłumaczy ci świat

REKLAMA

Pierwszy model językowy z serii Gemini 2.0 to 2.0 Flash. Według producenta ma cechować się nie tylko lepszą wydajnością, niższymi opóźnieniami względem dotychczasowego modelu 1.5 Flash. Ale też i nowymi funkcjami – Gemini będzie umieć także tworzyć obrazy, dźwięk, a nawet… zrozumie, co się dzieje na naszym ekranie podczas grania.

REKLAMA

Google Gemini 2.0 potrafi wiele. Zbyt wiele

Nowa wersja asystenta Google’a ma wprowadzać także ulepszenia w zakresie multimodalności – czyli obsługi danych wyciąganych z różnych, często związanych ze sobą źródeł – tekstu, obrazu, dźwięku, wideo. Google w komunikacie dotyczącym Gemini 2.0 mówi również o lepszym przetwarzaniu długich, skomplikowanych kontekstów.

Świeżo wydane oprogramowanie nie jest dostępne wyłącznie dla deweloperów i najbardziej zaawansowanych użytkowników za sprawą narzędzi takich jak Google AI Studio czy Vertex AI. Także i zwykli użytkownicy asystenta Gemini mogą skorzystać z najnowszej wersji 2.0 Flash w formie czatu, uruchamiając stronę internetową Gemini na komputerze, laptopie lub smartfonie. Według Google odświeżone wydanie asystenta niebawem pojawi się w aplikacji mobilnej Gemini.

Gemini 2.0 Flash jest już dostępny

Gemini 2.0 Flash przyniesie nie tylko bardziej adekwatne, celniejsze odpowiedzi na pytania zadane przez użytkownika, ale też ulepszenia narzędzi, które wyglądają jak usługi z przyszłości – Projektu Astra oraz Projektu Mariner. Pierwszy z nich stanowi usługę umożliwiającą rozumienie świata rzeczywistego - ma funkcję identyfikowania obiektów, dźwięków i wyciągania innych informacji z obrazu widzianego przez obiektyw telefonu lub innego urządzenia w czasie rzeczywistym.

Gemini 2.0 wprowadza szereg ulepszeń do Projektu Astra – rozumienie większej liczby języków, akcentów, nietypowych słów oraz obsługę narzędzi typu wyszukiwarka Google, Mapy Google, Obiektyw Google. Model językowy ulepsza kwestię zapamiętywania informacji, dzięki czemu asystent pamięta m.in. rozmowy przeprowadzone z użytkownikiem, które odbyły się do 10 minut wstecz.

Project Mariner to natomiast narzędzie stworzone dzięki Gemini 2.0. Usługa będzie dostępna jako rozszerzenie dla przeglądarki Chrome. Oprogramowanie w wielkim skrócie ma rozumieć wszystko, co się dzieje na ekranie komputera. Informacje zebrane z przeglądarki mają służyć do wykonywania określonych zadań, które zleci użytkownik – m.in. umożliwi na poruszanie się po przeglądarce, pisanie, klikanie w aktywnych kartach, a nawet wykonywanie zakupów - ale tylko po uzyskaniu zgody użytkownika.

To jednak nie wszystko. Google stworzył agenta sztucznej inteligencji na podstawie Gemini 2.0, który umożliwia wykonywanie czynności w grach wideo. Gigant technologiczny przekazał, że narzędzie we wczesnej fazie potrafi wyciągać wnioski na temat gry i sugerować użytkownikowi co ma robić w czasie rzeczywistym.

Wydanie oznaczone numerem 2.0 zostanie wprowadzone również do funkcji podsumowania AI w wyszukiwarce Google, które jest obecnie dostępne dla miliarda użytkowników w wielu regionach. W Polsce i Europie jeszcze nie możemy skorzystać z tej opcji, ale gigant pochwalił się, że w ciągu następnego roku podsumowania AI mają zostać udostępnione na nowych rynkach. Czy Unia Europejska będzie jednym z nich? Zobaczymy.

REKLAMA

Więcej o sztucznej inteligencji przeczytasz na Spider's Web:

REKLAMA

Albert Żurek

11.12.2024 19:01

Tagi: Gemini Google Sztuczna inteligencja (AI)

Najnowsze

21:57

Google ze świetną nowością. Osiem razy szybsze prognozy

Aktualizacja: 2025-11-24T21:57:08+01:00