REKLAMA

Chcą rozwiązać największe tajemnice fizyki. Przeszkodą jest nasza wiedza

Naukowcy chcą wykorzystać sztuczną inteligencję do rozwiązania jednego z największych problemów współczesnej kosmologii - znalezienia nowej fizyki. Jednak aby odkryć nową fizykę, sztuczna inteligencja musi oduczyć się tej starej.

Naukowcy chcą wykorzystać sztuczną inteligencję do rozwiązania jednego z największych problemów współczesnej kosmologii - znalezienia nowej fizyki. Jednak aby odkryć nową fizykę, sztuczna inteligencja musi oduczyć się tej starej.
REKLAMA

Współczesna kosmologia znalazła się w ślepym zaułku własnego sukcesu. Standardowy model kosmologiczny doskonale opisuje ewolucję wszechświata, od Wielkiego Wybuchu po rozmieszczenie galaktyk. Fizycy mają jednak pełną świadomość, że ta teoria jest niekompletna.

Najnowsze obserwacje sugerują, że zjawiska takie jak masywne neutrina, zmodyfikowana grawitacja czy ewoluująca ciemna energia mogą wskazywać na nową fizykę wykraczającą poza obecny model.
Testowanie tych alternatyw wymaga przeprowadzenia ogromnej liczby precyzyjnych symulacji wirtualnych wszechświatów przy różnych założeniach fizycznych, często wymagających ogromnych zasobów obliczeniowych.

REKLAMA

Z pomocą może przyjść sztuczna inteligencja, a dokładniej technika zwana transfer learningiem (uczeniem transferowym). Obiecuje ona gigantyczne oszczędności czasu i mocy obliczeniowych. Jednak najnowsze badanie opublikowane w prestiżowym czasopiśmie Journal of Cosmology and Astroparticle Physics (JCAP) pokazuje, że algorytmy, zamiast ułatwić nam odkrywanie nowej fizyki, mogą nas na nią po prostu oślepić. Okazuje się bowiem, że systemy AI bywają zbyt przywiązane do wiedzy, którą już posiadają.

Nauka na skróty

W nowym artykule zbadano, czy transfer wiedzy, technika, w której systemy sztucznej inteligencji ponownie wykorzystują wiedzę zdobytą w trakcie realizacji jednego zadania, aby przyspieszyć uczenie się w ramach innego, może sprawić, że proces ten stanie się znacznie bardziej efektywny.

REKLAMA

W tym przypadku naukowcy najpierw przeszkolili sieć neuronową na symulacjach opartych na modelu standardowym kosmologii (zwanym Modelem Lambda-CDM), proces ten nazywa się wstępnym trenowaniem, a następnie dostosowali ją do bardziej złożonych modeli kosmologicznych, które mogą uwzględniać nową fizykę.

Zamiast trenować sieć neuronową od zera na potwornie drogich obliczeniowo symulacjach alternatywnych fizyk, naukowcy postanowili wysłać ją najpierw do podstawówki. W fazie tzw. pretreningu nakarmili algorytm prostszymi i znacznie tańszymi w generowaniu modelami opartymi na dobrze znanym standardzie Modelu Lambda-CDM. Dopiero gdy AI zrozumiała podstawowe mechanizmy rządzące kosmosem, została dopasowana do analizy bardziej skomplikowanych scenariuszy, w których zakłada się istnienie nowych zjawisk fizycznych.

REKLAMA

Więcej na Spider's Web:

Adrian Bayer, kosmolog z Flatiron Institute oraz Uniwersytetu Princeton i współautor tych badań, porównuje tę metodę do ludzkiej edukacji. Zamiast rzucać studenta od razu na głęboką wodę i kazać mu studiować skomplikowany, specjalistyczny podręcznik akademicki, najpierw daje mu się do przeczytania prosty wstęp do tematu.

REKLAMA

Dopiero mając solidne podstawy, człowiek jest w stanie przyswoić zaawansowaną wiedzę bez wertowania słownika przy każdym zdaniu. W przypadku sieci neuronowych ta strategia zadziałała nadzwyczaj dobrze pod względem ekonomicznym. W niektórych testowanych scenariuszach transfer learning pozwolił zmniejszyć liczbę potrzebnych, drogich symulacji ponad dziesięciokrotnie.

To w zasadzie droga na skróty. Zwykle ludzie trenują sztuczną inteligencję bezpośrednio na najbardziej kosztownych obliczeniowo symulacjach. Zamiast tego najpierw używamy prostszych i tańszych symulacji Modelu Lambda-CDM, aby dać sztucznej inteligencji pojęcie o tym, co się dzieje, a dopiero potem przechodzimy do bardziej złożonych modeli - wyjaśnia Adrian Bayer.

Pomysł przypomina studiowanie trudnego tematu poprzez lekturę podręcznika wprowadzającego. Najpierw czyta się książkę podstawową, żeby zorientować się w temacie - mówi Bayer - a potem przechodzi się do naprawdę skomplikowanej książki.

REKLAMA

Według Veeny Krishnaraj, studentki Uniwersytetu Princeton, pierwszej autorki artykułu, strategia ta pozwala uniknąć zmuszania sztucznej inteligencji do przetwarzania wszystkiego na raz.
Wyniki pokazują, że takie podejście może działać niezwykle skutecznie. W niektórych przypadkach transfer uczenia zmniejszył liczbę potrzebnych kosztownych symulacji ponad dziesięciokrotnie.

Kiedy podręcznikowa wiedza staje się pułapką

Jednak badanie ujawniło również subtelniejsze zjawisko znane jako transfer negatywny.

Wracając do analogii podręcznika Bayera, jest to trochę tak, jakby studiować medycynę na podstawie podręcznika dla początkujących, a następnie zetknąć się z rzadką chorobą, której objawy przypominają powszechnie występujące choroby - wcześniejsza wiedza jest pomocna w większości przypadków, ale może też popchnąć czytelnika w stronę błędnej interpretacji.

REKLAMA

Coś podobnego może się zdarzyć w przypadku systemów sztucznej inteligencji. Czasami efekty generowane przez nową fizykę bardzo przypominają wzorce już skojarzone ze standardowym modelem kosmologicznym. W takich przypadkach sztuczna inteligencja interpretuje nowe informacje, wykorzystując kategorie poznane podczas wstępnego treningu, co utrudnia, a nie ułatwia, rozpoznawanie prawdziwie nowych efektów.

Naukowcy zaobserwowali to zachowanie w symulacjach z udziałem masywnych neutrin. Niektóre efekty generowane przez masę neutrin są bardzo zbliżone do zmian związanych z istniejącym parametrem Modelu Lambda-CDM, znanym jako σ8, który opisuje, jak silnie materia skupia się we Wszechświecie. W rezultacie wstępnie wytrenowana sieć początkowo miała trudności z rozróżnieniem tych dwóch efektów.

Ujemny transfer nie jest losowy. Jest on napędzany przez ukryte degeneracje fizyczne modelu. Innymi słowy, różne parametry fizyczne mogą dawać bardzo podobne obserwowalne efekty, co utrudnia sztucznej inteligencji ich prawidłowe rozróżnienie. Musimy więc być tego świadomi i starać się to łagodzić – podsumowuje Krishnaraj.

Praca podkreśla zarówno obietnice, jak i zagrożenia związane ze stosowaniem strategii modelu podstawowego, koncepcyjnie podobnych do tych, które leżą u podstaw współczesnej generatywnej sztucznej inteligencji i dużych modeli językowych, do fizyki fundamentalnej. Jak piszą autorzy w artykule, wstępne trenowanie może przyspieszyć wnioskowanie, ale "może również utrudniać uczenie się nowej fizyki".

REKLAMA

Na razie metoda została przetestowana na symulacjach, co stanowi podstawę do zastosowania jej w rzeczywistych danych obserwacyjnych. Naukowcy postrzegają ją jako potężne narzędzie do przyszłych badań kosmologicznych, które w nadchodzących latach wygenerują bezprecedensową ilość precyzyjnych danych o Wszechświecie.

REKLAMA
Bogdan Stech
Redaktor

Dziennikarz Spider's Web, zajmuje się tematyką militariów i obronności. Jest pasjonatem lotnictwa, broni pancernej i miłośnikiem symulatorów. Pisze o nowych technologiach, takich jak broń hipersoniczna czy laserowa. Interesuje się historią konfliktów oraz Chin i Wietnamu w XX wieku. Dziennikarzem jest od 1998 roku. Pracował w Super Expressie, Gazecie Wyborczej, Purepc. Jest autorem trzech książek poświęconych wojnie w Wietnamie. Prywatnie interesuje się również fizyką, grami, kotami i kolarstwem górskim.

REKLAMA
REKLAMA
REKLAMA
REKLAMA