OpenAI ogłosiło przełom w matematyce. Uwierzyli botowi i się skompromitowali
Spektakularne ogłoszenie o geniuszu GPT-5 wytrzymało do tweeta pierwszego matematyka. Ten wskazał, że "przełom" był w literaturze od lat. OpenAI musiało w pośpiechu kasować posty i przepraszać.

Jeżeli przeglądając czasopisma naukowe przypadkowo natrafiłeś na nieznaną wcześniej publikację opisującą opracowanie leku na rzadką chorobę, to czy możesz powiedzieć, że "odkryłeś lek"? Choć odpowiedź jest oczywista, to mniej-więcej taką logiką posłużyło się OpenAI przypisując GPT-5 nowe odkrycie matematyczne.
OpenAI świętowało nie swój sukces. Po krytyce pracownicy w panice kasowali wpisy
W miniony weekend prominentni pracownicy OpenAI ogłosili w serii postów na X, że GPT-5 "znalazł rozwiązania do 10 (!) wcześniej nierozwiązanych problemów Erdősa" i poczynił postępy w kolejnych jedenastu. W komunikatach użyto języka sugerującego, że model nie tylko wyszukał publikacje, ale faktycznie rozwiązał długo otwarte zagadnienia z teorii liczb - co brzmiało jak potencjalny naukowy przełom.

Problemy Erdősa - nazwane tak na cześć wybitnego węgierskiego matematyka Paula Erdősa - to zbiór trudnych hipotez i pytań z zakresu kombinatoryki, teorii liczb i teorii prawdopodobieństwa. Wiele z nich pozostaje nierozwiązanych od dekad z prostego powodu: wymagają narzędzi matematycznych, których ludzkość jeszcze nie wymyśliła, albo potężnej pracy dowodowej, której nikt dotąd się nie podjął. Status różnych problemów Erdősa można śledzić na specjalnej stronie internetowej, na której problemy oznaczone jako "otwarte" ("open") nie posiadają jeszcze rozwiązania. Nie oznacza to jednak, że są nierozwiązane - może to także oznaczać, że do właścicieli witryny nie dotarła wiadomość o znalezieniu rozwiązania.
Sęk w tym, że OpenAI nie rozróżniło "zagadnienia otwartego w sensie matematycznym" od "zagadnienia, które ma rozwiązanie, o którym kurator witryny nie wiedział". Thomas Bloom, matematyk prowadzący portal erdosproblems.com, z którego korzystał zespół OpenAI, zareagował natychmiast: wyjaśnił, że "otwarte" na jego stronie oznacza jedynie, że nie jest mu znana publikacja opisująca rozwiązanie danego przypadku, a GPT-5 po prostu wskazał istniejące już w literaturze prace, których Bloom nie miał w zbiorze swojej witryny. Nie było żadnego nowego dowodu - jedynie skuteczne wyszukiwanie informacji ze strony czatbota.
Chwilę później wybuchła fala krytyki ze środowiska nauki i AI. Demis Hassabis, szef Google DeepMind, określił sytuację jako "żenującą", a Yann LeCun z Mety dopowiedział na X, że OpenAI "dało się nabrać na własnego GPTebila".
Wobec czego posty od OpenAI z fetowaniem "przełomu" w pośpiechu skasowano. Główni autorzy zaczęli tonować przekaz, tłumacząc, że chcieli jedynie podkreślić przydatność GPT-5 w przeszukiwaniu literatury naukowej.
Ironia losu polega na tym, że prawdziwa - i realnie ciekawa - wartość tej sytuacji została przykryta niezbyt przemyślanymi wpisami OpenAI.
GPT-5 pokazał coś ważnego, tylko OpenAI sknociło ogłoszenie
GPT-5 okazał się narzędziem, które potrafi znacząco przyspieszyć przeszukiwanie rozległej literatury naukowej, zwłaszcza tam, gdzie nazewnictwo jest niespójne, a rozwiązania publikowane są w niszowych czasopismach. Terence Tao, jeden z najwybitniejszych współczesnych matematyków, od miesięcy powtarza, że właśnie w tym widzi najbliższy i najbardziej namacalny potencjał AI w matematyce: nie w generowaniu nowych twierdzeń, lecz w industrializacji żmudnych zadań - w wyszukiwaniu, porządkowaniu i streszczaniu wiedzy, której człowiek nie jest w stanie odsiać ręcznie.
[...] Jednak w przypadku systematycznego stosowania narzędzia do przeglądu literatury opartego na sztucznej inteligencji do dużego zbioru problemów, bardziej naturalne staje się zgłaszanie zarówno wyników pozytywnych, jak i negatywnych [...], co może pomóc w uzyskaniu dokładniejszego obrazu tego, czym faktycznie jest istniejąca literatura na dany temat
Afera z chaotyczną komunikacją OpenAI dorzuca - do już pokaźnej kolekcji - nowy epizod pokazujący w jakiej presji, pośpiechu i "bańce narracyjnej" działa firma. Gdy po Dolinie Krzemowej krążą inwestorzy gotowi wypłacić miliardy dolarów, reputacja bycia firmą "wyprzedzającą swoje czasy" jest na wagę złota. Złota, które przez garść źle dobranych słów potrafi zamienić się w błoto.
Może zainteresować cię także: