Sztuczna inteligencja nauczyła się nowych sztuczek. Nowy model Stability AI pokazał, jakie cudne grafiki tworzy
Papież w kurtce od Midjourney to wierzchołek góry lodowej jeżeli chodzi o to, co może wygenerować SI. Stability AI wydało właśnie model tak dobry w fotorealizmie, że nowa fala deep fake'ów to tylko kwestia czasu.
Pomimo że Stability AI ma na karku kilka problemów - zarówno ze względu na naruszenia praw autorskich, jak i typowo finansowych. Mimo to startup nie spowalnia rozwoju, a swój najnowszy model stworzyło z myślą o głębokich kieszeniach dużych firm i koncernów.
Stability AI ogłosiło stworzenie nowego modelu generatywnej SI Stable Diffusion XL (SDXL). Nowy model to ulepszona wersja popularnego Stable Diffusion 2.1, jednak jak zaznacza Stability AI "to jeszcze nie jest Stable Diffusion 3.0". Co więc nowego?
Nowy model Stable Diffusion to mistrz deep fa... fotorealizmu
Przede wszystkim Stability AI skupiło się na ulepszeniu możliwości SI w generowaniu fotorealistycznych obrazów. Poprawiono także generowanie twarzy i dłoni oraz dostosowano SDXL do działania na krótszych, mniej złożonych promptach. Jak podaje firma, model oprócz generowania obrazów metodą text-to-image jest w stanie generować je innymi metodami, takimi jak image-to-image (tworzenie wariacji innego obrazu), inpaiting (rekonstruowanie brakujących części obrazu) czy outpainting (tworzenie "rozwinięć" istniejących obrazów).
Jak podaje Stability AI, za potencjałem modelu stoi znacznie zwiększona liczba parametrów. W przypadku innych modeli Stable Diffusion ich liczba wynosiła około 900 milionów, z kolei SDXL został wytrenowany na 2,3 miliarda parametrów. Ponadto firma stale dostraja model na podstawie opinii testerów.
Choć model brzmi jako idealny generator deep fake'ów, to jego pełna wersja jest w fazie zamkniętej bety. Obecnie Stability AI daje dostęp do ograniczonej wersji poglądowej Stable Diffusion XL Beta Preview poprzez aplikację webową DreamStudio. Jednak jak zapowiada brytyjska firma, Stable Diffusion XL - pomimo bycia stworzonym z myślą o klientach biznesowych - również stanie się modelem open-source, do którego dostęp będą mogli zyskać wszyscy zainteresowani.