Google pokazał nowe Gemini. Klika i przewija jak człowiek
Gemini 2.5 Computer Use to nowy model AI, który może marnować czas w internecie za ciebie, podczas gdy ty posprzątasz w kuchni albo zrobisz pranie. Chyba miało być na odwrót, nie?

Google zaprezentował najnowszą wersję swojego modelu sztucznej inteligencji. Gemini 2.5 Computer Use potrafi obsługiwać przeglądarkę internetową niemal tak samo jak człowiek - klika, przewija strony, wypełnia formularze i przeciąga elementy na ekranie.
Gemini 2.5 Computer Use zmienia dynamikę relacji człowiek-internet. On marnuje czas, żebyś ty mógł być pożytecznym członkiem społeczeństwa
Obecnie większość systemów sztucznej inteligencji pobiera dane z internetu głównie przez specjalne programistyczne interfejsy (API), pozwalające w łatwy sposób komunikować się AI z usługą i wykonywać polecenia - tak jak robią to np. aplikacje w ChatGPT. Problem w tym, że wiele usług czy stron wciąż nie jest dostosowana do tego typu interakcji ze strony AI i wymaga "klasycznej" obsługi - zalogowania się, zaznaczenia pola wyboru albo przesunięcia kursora i klikania. Google chce, aby jego sztuczna inteligencja potrafiła poradzić sobie właśnie z takimi zadaniami, bez konieczności stosowania skomplikowanych API.
W tym celu powstał Gemini 2.5 Computer Use. Model działa poprzez analizowanie zrzutów ekranu i na ich podstawie może podjąć działania: kliknąć przycisk, wpisać tekst czy przeciągnąć element w odpowiednie miejsce. To sprawia, że w praktyce porusza się po internecie dokładnie tak, jak zwykły użytkownik.
Gemini wyręczy cię nie tylko w pracy biurowej
Zastosowań jest sporo. Gemini może pomóc w automatycznym wypełnianiu skomplikowanych formularzy, obsłudze sklepów internetowych, a także w porządkowaniu treści na stronach czy w aplikacjach. Google na specjalnie przygotowanych filmikach pokazuje przykłady, w których AI samo kupuje produkty, zapisuje wizyty w kalendarzu albo segreguje notatki na wirtualnej tablicy.
Zgodnie z deklaracjami koncernu, technologia ma też być użyteczna dla firm - np. przy testowaniu aplikacji i stron, gdzie dotąd takie zadania wymagały wielu godzin pracy ludzi.
A co z bezpieczeństwem?
Oddanie przeglądarki w ręce AI niesie ryzyko - np. że model kliknie podejrzany link albo zostanie zmanipulowany przez złośliwą stronę. Google zapewnia, że wbudowało zabezpieczenia, które mają ograniczać takie sytuacje. Niektóre działania modelu, takie jak np. dokonywanie zakupów, będą wymagały dodatkowego potwierdzenia od użytkownika.
Na razie Gemini 2.5 Computer Use dostępny jest w wersji testowej dla programistów i firm poprzez narzędzia Google AI Studio oraz Vertex AI.
Może zainteresować cię także: