Sora od OpenAI działa niczym magia. Jedna fraza - i film gotowy
OpenAI właśnie zapowiedziało zupełnie nową usługę generatywnej sztucznej inteligencji. Poza generatorem obrazów DALL-E oferować też będzie Sorę, generującą fotorealistyczne klipy wideo.
Za sprawą DALL-E użytkownicy takich usług, jak Microsoft Copilot, mogą generować obrazy wideo posługując się wyłącznie opisami tekstowymi. Model SI od OpenAI w kilka chwil zapewnia bardzo przekonująco wyglądające grafiki i cieszy się ogromną popularnością. Teraz będąca w ścisłym sojuszu z Microsoftem firma zapowiada nowy model SI o nazwie Sora. Będzie dostępny do testów lada moment i właśnie jest udostępniany pierwszym partnerom. Służy do generowania klipów wideo.
Za sprawą sztucznej inteligencji informatyka zmienia się nie do poznania. Nie przegap tych tekstów:
Sora - rewolucja SI w branży wideo?
Sora, jak twierdzi OpenAI, jest w stanie wygenerować złożone sceny z wieloma postaciami, rozmaitymi rodzajami ruchów kamery, zachowując przy tym wysoką szczegółowość pierwszego planu, jak i wszystkich pozostałych. Model rozumie przy tym wpływ emocji na mimikę, pozwala też na dokładne opisywanie mających pojawić się w klipie rekwizytów. Sora pozwala też na tworzenie materiałów wideo po zapewnieniu modelowi statycznego obrazu, może też działać jako mechanizm upłynniający klipy wideo zapisane w niskim klatkażu.
Szczegóły technicznie nie są jeszcze znane. Sora testowana będzie bowiem na razie przez ściśle kontrolowane grupy użytkowników pochodzących od partnerów firmy. Model ma być bowiem intensywnie testowany pod względem bezpieczeństwa, by nie mógł być wykorzystany do tworzenia szkodliwych lub wręcz nielegalnych treści. OpenAI nie podaje przewidywanego terminu zakończenia testów. Być może dlatego Microsoft jeszcze się nie chwali integracją Sory w jego aplikacjach.
Materiały demonstracyjne zapewnione przez OpenAI robią jednak wrażenie. Powyższy klip powstał po wprowadzeniu polecenia:
Stylowa kobieta idzie ulicą Tokio wypełnioną ciepłymi, świecącymi neonami i animowanymi oznakowaniami miasta. Nosi czarną skórzaną kurtkę, długą czerwoną sukienkę i czarne buty i nosi czarną torebkę. Nosi okulary przeciwsłoneczne i czerwoną szminkę. Chodzi pewnie i swobodnie. Ulica jest wilgotna i odblaskowa, tworząc lustrzany efekt kolorowych świateł. Przechadza się wielu pieszych.
Niestety nie wiemy, ile czasu produkcyjna wersja Sory potrzebować będzie na wygenerowanie takiego klipu użytkownikowi.
Ilustracja otwierająca: FellowNeko / Shutterstock