REKLAMA

Agent ChataGPT miał mi wybrać komputer. Zaproponował kapcie

Kiedy powierzyłam Agentowi ChataGPT zadanie złożenia gamingowego komputera za 7000 zł, otrzymałam zestaw linków do spinek do mankietów oraz butów. Czy nowy asystent OpenAI może naprawdę być sekretarką przyszłości?

Test Agenta w ChatGPT
REKLAMA

ChatGPT Agent pojawił się na rynku w atmosferze wielkich obietnic - jako zaawansowane narzędzie, które ma nie tylko odpowiadać na pytania, ale samodzielnie podejmować konkretne działania. Postanowiłam sprawdzić, czy ten cyfrowy pomocnik rzeczywiście jest w stanie zastąpić człowieka, czy jego świetlana przyszłość kończy się na zamawianiu pizzy.

REKLAMA

Co to jest właściwie ten cały Agent?

ChatGPT Agent to coś więcej niż kolejny gadżet z laboratorium OpenAI - to nowa inkarnacja cyfrowego asystenta, który nie tylko odpowiada na pytania, ale samodzielnie podejmuje działania. Wyposażony w zestaw narzędzi takich jak przeglądarka internetowa, terminal, dostęp do API czy połączenia z aplikacjami typu Gmail czy Google Calendar, ChatGPT Agent potrafi analizować dane, wypełniać arkusze kalkulacyjne, planować spotkania, przygotowywać prezentacje i poruszać się po internecie niemal tak sprawnie jak człowiek. Co najważniejsze - robi to z wykorzystaniem własnego, wirtualnego komputera, wykonując zadania od początku do końca bez potrzeby ciągłego nadzoru.

Jak opisuje samo OpenAI, ChatGPT Agent to "przełomowe połączenie rozumu i działania", w którym wcześniejsze projekty OpenAI - takie jak Operator (interakcja ze stronami) i deep research (głębokie analizy podanych informacji) - zlewają się w jeden spójny system. ChatGPT Agent nie tylko słucha, ale działa - potrafi kliknąć, filtrować wyniki, przeanalizować je i wrócić z gotowym efektem, niczym zdolny asystent, który nie czeka na instrukcje krok po kroku, lecz potrafi sam wybrać najlepszą drogę do celu. A to wszystko przy zachowaniu kontroli po stronie użytkownika - z możliwością zatrzymania, poprawy lub przejęcia zadania w każdej chwili.

Obietnice były spore, dlatego gdy tylko uzyskałam dostęp do Agenta, nie wahałam się ani chwili i zaczęłam korzystanie. A to jest niezwykle proste - z dobrze znanego użytkownikom ChatGPT menu narzędzi wystarczy wybrać "Agent Mode" i zacząć wpisywać treść instrukcji do zadania.

Jakkolwiek skomplikowanie by nie brzmiał, Agent to po prostu tryb z rozwijanego menu

Pierwsze koty za płoty w Zakopanem

Pierwszy test "dla wybadania terenu" był całkiem prosty: kazałam agentowi przygotować plan pobytu w Zakopanem. W instrukcji zawarłam nasze podstawowe personalia (wiek, płeć, zainteresowania oraz sprawność fizyczną), nasz cel (amatorskie chodzenie po górach i zwiedzanie najbardziej znanych atrakcji), ograniczenia (wyłącznie transport publiczny, datę przyjazdu i odjazdu) oraz kilka miejsc, którymi już byliśmy zainteresowani. Oprócz spisania planu w pliku tekstowym, poprosiłam ChatGPT także o stworzenie arkusza kalkulacyjnego w którym zawarta będzie lista rzeczy do spakowania do walizki oraz do plecaka przy ruszaniu na szlak.

To konkretne zadanie uznałam za wybadanie terenu, bo plan i listę rzeczy już napisałam jakiś czas temu, a sama instrukcja była napisana w języku ojczystym ChatGPT - angielskim. Dlatego byłam w stanie mniej-więcej zobaczyć czy mój nowy asystent wie jak mi dogodzić.

W czasie działania nad zadaniem użytkownikowi wyświetla się animacja, z której dowiaduje sie on co teraz robi Agent i dlaczego

Odsiedziałam swoje, bo buszowanie po internecie i spisanie wszystkiego zajęło agentowi 11 minut. Lista udała się umiarkowanie, bo w jednej kolumnie ChatGPT wpisał zarówno ilość jak i opis, pomimo sprecyzowania w języku angielskim, że jesteśmy z Polski zaproponował adaptery do europejskich gniazdek, a sprecyzowanie że wycieczka ma być we wrześniu zmotywowała go do zaproponowania nam odzieży zimowej.

Możemy także podejrzeć jak tworzone są zlecone pliki - tak wygląda generowanie arkusza z listą rzeczy do spakowania

Sam plan nie był zły i dla szlaków zawierał wszystkie podstawowe informacje - jak się dostać, ich długość, poziom trudności, gdzie można nadłożyć drogi dla dodatkowej atrakcji (np. Smocza Jama w Dolinie Kościeliskiej) oraz ile będzie trwało wejście. Jednak plan był daleki od czegoś, co można by dać klientom biura turystycznego lub nieogarniętym znajomym. Agent wyszedł z założenia, że przyjeżdżając do Zakopanego pociągiem o 9 rano od razu się zameldujemy, zjemy śniadanie i pójdziemy na Gubałówkę. Z kolei ostatniego dnia wyszedł z założenia, że mając pociąg o 11, jeszcze da się wskoczyć z rana na śniadanie i na szlak. W pełnych dniach pobytu, pomimo wpisania orientacyjnego czasu potrzebnego na wejście i zejście, plan nie był rozpisany czasowo i miejscami zakładał jeden sześciogodzinny szlak i trzy muzea - zdecydowanie zbyt dużo na amatorską tężyznę fizyczną. Za to ta sama wspomniana amatorskość sprawiła, że namiętnie sugerował nam on atrakcje dla dzieci.

Mimo to dałam mu drugą szansę, napisałam kolejną instrukcję dla zadania, dwa razy dłuższą niż poprzednia i tym razem w języku polskim. Doprecyzowałam instrukcję, dodałam szczegółów, dałam także Agentowi polecenia, by pewne szczegóły ominął.

Po kolejnych 9 minutach oczekiwania (i w sumie około 25 minutach od momentu podjęcia pracy, bo napisanie promptów chwilę zajęło), otrzymałam całkiem satysfakcjonujący plan podróży i plan pakowania się. Całość jest naprawdę długa więc ciężko mi ją przekleić, ale z czystym sumieniem mogę powiedzieć, że każda osoba umiejąca dobrze pisać prompty, a zarazem planująca wypad do popularnego kierunku turystycznego, może powierzyć Agentowi napisanie planu podróży.

Zainspirowana tym małym-wielkim suckesem, wrzuciłam Agenta ChatGPT na głęboką wodę: składanie komputera.

Gamingowy zestaw galanteryjny

Nauczona doświadczeniem, tym razem napisałam mu długi na 1643 znaki opis zadania, zgodnie z którym w budżetach 7000 zł (komputer) i 3000 zł (monitory) miał złożyć komputer do gier. W instrukcji uwzględniłam tak gry w które chciałabym na nim grać, jak i zastosowania komputera poza grami. Doprecyzowałam czy mam jeszcze jakieś wymogi (był to m.in. kolor części - preferuję biały, ale jeżeli nie da się złożyć w pełni białego to chcę w pełni czarny, a także fakt że chcę mieć płytę główną z Bluetooth i Wi-Fi). Jednak największym wyzwaniem była oczywiście forma zestawu komputerowego.

Przygotuj dla mnie zestaw komputerowy. Zestaw powinien być gotowy do kupienia w koszyku dowolnego sklepu internetowego. Jeżeli uzyskanie najniższych możliwych cen oznacza kupowanie w kilku różnych sklepach, dodaj niezbędne przedmioty do koszyka w różnych sklepach. Jeżeli z jakiegoś powodu nie możesz dodać przedmiotów do koszyka, wygeneruj plik csv z kolumnami "Część", "Sklep", "Cena", "Link" w którym zawrzesz niezbędne elementy zestawu komputerowego, gotowe do kupienia dla użytkownika.

Odwiedzenie polskich sklepów nie stanowi problemu dla Agenta

Agent niestety z jakiegoś powodu nie był w stanie przejść do koszyka, dlatego wygenerował mi plik .csv. Cały zestaw był poprawny - części pasowały do siebie, a ich wydajność odpowiada mniej-więcej temu czego oczekuję.

Problemem okazały się linki.

Pomimo że podlągałam jak ChatGPT Agent pracuje i w czasie rzeczywistym podglądał najpopularniejsze sklepy z częściami komputerowymi w Polsce, podał mi linki do Ceneo. Myślę - "No ok, przynajmniej są linki".

Plik .csv wygenerowany przez Agenta i przekonwertowany na .xslx

Jakież było moje zdziwienie gdy zamiast karty graficznej otworzyła mi się strona spinki do mankietu, zamiast dysku kategoria "kapcie damskie", a mój komputer będzie zasilany butami trekkingowymi.

W tym przypadku zadanie uznaję za porażkę. Wiem że niektórzy mogliby się kłócić "no ale wygenerował ci dobrą listę części". Sęk w tym, że ChatGPT Agent ma być moim asystentem, upraszczać mi życie i być tym który przeczesuje zakamarki internetu zamiast mnie. Nie dość że nie spełnił zadania tak głośno reklamowanego przez OpenAI jakim jest wyręczanie w zakupach, to jeszcze zmusił mnie do ręcznego wyszukiwania sugerowanych przedmiotów. Przedmiotów które i tak nie spełniały założeń, bo były mieszanką czarnych i białych. A gdybym - odpukać - pozwoliła mu dokonać zakupów, kto wie, czy kurier właśnie nie dostarczałby mi zestawu galanterii damskiej.

Przyszłość jest dziś. Agent ChatGPT potrafi zamówić pizzę

Ale mam dobre serce. Głęboko wierzę, że mój Agent nie jest idiotą i może chociaż poradzi sobie z zamówieniem pizzy. Następne zadanie było równie proste, co przyjemne.

Zamów pizzę z kurczakiem i kukurydzą z dostawą w Bełchatowie. Chcę pizzę w najmniejszym rozmiarze oferowanym przez pizzerię. Nie mam preferencji co do pizzerii. Zależy mi jedynie na kurczaku i kukurydzy - na pizzy mogą być także inne dodatki. Mam preferencję pieczarek, ale nie jest to wymóg

Przejście do zamówienia pizzy zajęło Agentowi mniej niż 3 minuty

Agentowi w ChatGPT zajęło 2 minuty znalezienie odpowiedniej pizzy - po odwiedzeniu stron kilku lokalnych pizzerii skierował się on do Pyszne.pl, gdzie wybrał pizzę zgodną z wytycznymi, a następnie zatrzymał działanie, gdy Pyszne.pl poprosiło o adres dostawy. Wypełniłam go, po czym Agent ChatGPT po 27 sekundach ponownie się zatrzymał - strona prosiła o wypełnienie informacji o płatności. Tu sama zaniechałam kontynuowania, gdyż miałam inne plany na obiad, jednak uznaję zamówienie pizzy za sukces.

Głównie dlatego, że Agent ChatGPT sam wstrzymuje się od działania gdy konieczne jest wpisane danych użytkownika, więc nawet mając zamiar dokończyć zamówienie, tak czy tak to ja przejęłabym myszkę.

Cyfrowy architekt w akcji pozytywnie mnie zaskoczył

W kolejnym zadaniu przysiadłam do problemu, który tygryski lubią najbardziej. Zatrudniłam czatbota, bo nie stać mnie (albo nie chce mi się) na konsultację z ekspertem. Zleciłam Agentowi aby wygenerował dwa dokumenty tekstowe. W pierwszym miał przygotować bardzo ogólny kosztorys budowy domu 80m2 z założeniem, że mamy już działkę, ale nieuzbrojoną. "Bardzo ogólny", bo wiem że koszt materiałów zmienia się z miesiąca na miesiąc, a sam dom może być wykonany w różnych technologiach. Chodziło o bardzo ogólne i zawyżone widełki - tak aby mieć jakiekolwiek porównanie z drugą opcją, jaką jest kupno mieszkania. Dodatkowo w tym dokumencie Agent miał zawrzeć listę lokalnych usługodawców wraz z opisem zakresu usług i danymi kontaktowymi.

W drugim dokumencie Agent miał mi wytłumaczyć sam proces budowy domu. Bo budowa domu to nie złożenie dokumentów, przelew dużej sumy i magicznie, po jakimś czasie powstaje dom. Chciałam zrozumieć poszczególne etapy, czas ich trwania, konieczność takiej, a nie innej kolejności, czy to na jakim etapie, jakie mogę wprowadzić zmiany.

Na wykonanie zadania agent potrzebował w sumie 17 minut. Oba dokumenty ponownie były bardzo obszerne, a sam Agent ChatGPT zrozumiał moją intencję "chcę tylko rozeznanie". Ze wszystkich zadań, jakie powierzyłam, to dało mi najbardziej satysfakcjonującą odpowiedź. Jednak tę satysfakcję traktowałabym z przymrużeniem oka, bo przede wszystkim Agent miał do dyspozycji bardzo dużą ilość danych.

Gdybym zaczęła operować bardzo szczegółowym poleceniem (precyzując np. czas wykonania, technologię czy specyficzne elementy konstrukcji), Agent mógłby się koncertowo wyłożyć. Do tego ja sama nie posiadam zbyt dużej (o ile jakiejkolwiek) wiedzy budowlanej, dlatego mogę być usatysfakcjonowana wygenerowanymi dokumentami ze względu na pewność siebie Agenta przy odpowiadaniu, jak i efekt potwierdzenia.

6 piersi 7 dni, czyli "uczepić się jak Agent kurczaka"

Wreszcie to co zabiegani dorośli lubią najbardziej, czyli planowanie posiłków. Agent otrzymał ode instrukcję by uwzględniając zgromadzone w domu składniki, których chcę się pozbyć (m.in. rosół, 6 piersi z kurczaka, trzy opakowania warzyw na patelnie (mieszanki indyjska, grecka, hiszpańska), opakowanie mrożonego groszku 600 gram) oraz zakładając że mam w domu wszystkie typowe składniki (m.in. makaron, mąka, ryż, fasola) i przyprawy, przygotował tygodniowy jadłospis. Ograniczenie było takie, że obiady muszą być różnorodne (np. nie mogę trzy dni pod rząd jeść kurczaka z ryżem i różnymi warzywami) ani nie mogą się powtarzać (np. nie mógł mi zasugerować trzech zup z pozostałego rosołu). Gotowy jadłospis miał mieć formę pliku .docx, a dodatkowo Agent miał także przygotować listę zakupów w formacie arkusza .xslx, dzięki której za jednym zamachem zakupię wszystkie brakujące składniki.

Efekt wygenerowany po 12 minutach "myślenia" był... zadowalająco nudny. Zadowalający gdyż spełniał wymóg różnorodności, przebierając w różnych kuchniach i każdego dnia przytulając inną kuchnię. Jednak przez całe siedem dni Agent sugeruje piersi z kurczaka - pomimo że tych ma do dyspozycji tylko sześć, a ja nie ograniczyłam mu możliwości dokupu mięsa. Agent sięgnął dwa razy po makaron i dwa razy po ryż (curry z wtorku serwowane jest z ryżem), ale ani razu po kaszę czy ziemniaki.

Nie wiem czy to kwestia złego napisania promptu czy samej ułomności technologii - być może ChatGPT w typowy dla generatywnej sztucznej inteligencji "uczepił się jak rzep psiego ogona" składników wymienionych w instrukcji i zaniechał otwarcia się na inne możliwości. Jednak o ile nie jest się na lekkostrwanej diecie, jadłospis Agenta jest nudny. Zadowalający, ale nudny.

Te wszystkie i i kilka innych eksperymentów to całkiem fajny pokaz tego jak Agent ChatGPT może działać w rękach przeciętnego użytkownika internetu. Bo choć generowanie odpowiedzi trwa znacznie dłużej niż w przypadku zwykłego chatbota, to te są znacznie bardziej rozwinięte, szczegółowe i dają możliwość gotowego formatowania (np. poproszenie o wygenerowanie odpowiedzi w formie tabeli w pliku .docx), czyli coś co łącznie zabrałoby nam z życia dobre kilka godzin.

Tu jednak rodzi się pytanie dla kogo jest Agent ChatGPT? Przynajmniej w swej obecnej formie.

Cyfrowy służący czy zabawka dla nerdów?

Bo ten dostępny jest tylko dla subskrybentów ChatGPT Plus (ok. 100 zł miesięcznie) oraz ChatGPT Pro (ok. 800 zł miesięcznie). W pierwszym wariancie użytkownik otrzymuje limit 40 akcji/miesiąc (!), a w drugim 400/miesiąc. Akcja to nie tylko rozpoczęcie dialogu z Agentem i poproszenie go o wykonanie zadania, ale także przerwanie mu by przejąć kontrolę czy odpowiadanie gdy Agent poprosi o dodatkowy kontekst. Tak więc moje zamówienie pizzy - w ramach którego Agent poprosił o doprecyzowanie rozmiaru, a potem musiałam przejąć myszkę dwa razy - zjadło w sumie 4 akcje.

Z tej perspektywy Agent ChatGPT wydaje się być narzędziem dla ambitnych Kowalskich - którzy limitu raczej nie przekroczą i będą zadawać proste pytania. Tu jednak się rodzi pytanie: jakie gospodarstwo domowe lub jaka osoba zapłaci maszynie 100 zł/miesięcznie by raz na jakiś czas zaplanowała plan imprezy czy zrobiła risercz "bo mnie się nie chce"?

Limit skutecznie trzyma na smyczy także pracowników, którzy w swojej pracy stale tworzą raporty, podsumowania i prezentacje, oraz mikroprzedsiębiorców pokroju wedding planerów czy biur podróży, którzy prawdopodobnie w tydzień przejedli by się przez limit użyć.

REKLAMA

Jeszcze inna kwestia to fakt, że ChatGPT Agent jest fundamentalnie ograniczony. Pomijając wszystkie ułomności generatywnej sztucznej inteligencji, Agent wyszukuje jedynie za pomocą Binga Microsoftu - może pomijać wyniki lepiej zaindeksowane przez Google. Agent nie ma dostępu do mediów społecznościowych, które w moim przypadku były cennym źródłem informacji przy planowaniu wycieczki do Zakopanego. Agent ma ograniczone możliwości wejścia w interakcję z ludźmi i o ile można mu powierzyć napisanie maila, o tyle nie zadzwoni z pytaniem, na które odpowiedź natychmiast mogłaby zmienić bieg działania zadania. Agent może działać nie więcej niż 30 minut, a ktokolwiek robił pogłębione poszukiwanie informacji na jakikolwiek temat prawdopodobnie wie, że to ułamek czasu rzeczywiście potrzebnego na pozyskanie i analizę informacji.

Agent w ChatGPT zapowiada się interesująco i widzę w nim narzędzie, które za jakiś czas może rzeczywiście zredefiniować to w jaki sposób korzystamy z zasobów internetu. Jednak w obecnej formie to nadto wywyższany czatbot z fantazyjną przeglądarką w tle.

REKLAMA
Najnowsze
Aktualizacja: 2025-07-28T12:28:06+02:00
Aktualizacja: 2025-07-28T11:07:09+02:00
Aktualizacja: 2025-07-28T10:12:25+02:00
Aktualizacja: 2025-07-28T06:40:00+02:00
Aktualizacja: 2025-07-28T06:30:00+02:00
Aktualizacja: 2025-07-28T06:10:00+02:00
Aktualizacja: 2025-07-27T16:40:00+02:00
Aktualizacja: 2025-07-27T16:00:00+02:00
Aktualizacja: 2025-07-27T07:43:00+02:00
Aktualizacja: 2025-07-27T07:33:00+02:00
Aktualizacja: 2025-07-27T07:13:00+02:00
Aktualizacja: 2025-07-27T07:02:00+02:00
Aktualizacja: 2025-07-26T16:30:00+02:00
Aktualizacja: 2025-07-26T16:00:00+02:00
Aktualizacja: 2025-07-26T07:33:00+02:00
Aktualizacja: 2025-07-26T07:22:00+02:00
REKLAMA
REKLAMA
REKLAMA