Sora ma poważnego konkurenta. Veo 2 od Google pokazuje, co potrafi nowe narzędzie
Sora od OpenAI dosłownie przed chwilą powodowała u wielu słuszny opad szczęki. Tempo rozwoju sztucznej inteligencji jest jednak bezprecedensowe. Wystarczy tylko spojrzeć, co ma potrafić Veo 2.
Google Veo 2 to następca modelu Veo i bezpośrednia odpowiedź na zaprezentowaną niedawno OpenAI Sora. Podobnie jak konkurent, to generatywna sztuczna inteligencja służąca do generowania treści wideo. Ma jednak znacznie mniejsze ograniczenia od Sory. Ta generuje klipy w rozdzielczości Full HD o maksymalnej długości 20 sekund. Tymczasem Veo 2 generuje wideo w jakości Ultra HD, które może mieć długość nawet dwóch minut.
Jest tylko jeden haczyk. Veo 2 zapewne jest niezwykle kosztowny w utrzymaniu dla Google’a, przynajmniej na dziś. Dostęp do narzędzia jest ekstremalnie ograniczony. Można z niego korzystać raptem w kilku krajach (nie w Polsce), i to też nie od ręki. Najpierw należy się zapisać na waitlistę, czyli stanąć w wirtualnej kolejce po dostęp do usługi. Do momentu oddania tego tekstu do publikacji nie pojawiły się żadne publikacje prasowe, dostępu do Veo 2 nie mają na dziś nawet najbardziej prestiżowe media. Google zresztą wprost przyznał, że Veo 2 nie jest gotowy do wdrożenia na większą skalę.
Czytaj też:
Ponoć to nie długość jest najważniejsza. Google o tym nie zapomniał
Co więc nowego w Veo 2, w porównaniu do poprzedniego modeli? Jak twierdzi Google, model może generować klipy w różnych stylach, ma lepsze zrozumienie fizyki i sterowania kamerą oraz produkuje wyraźniejsze materiały filmowe. Przez wyraźniejsze Google rozumie, że tekstury i obrazy w klipach są ostrzejsze - szczególnie w scenach z dużą ilością ruchu.
Jeśli chodzi o ulepszone sterowanie kamerą, umożliwiają one Veo 2 dokładniejsze pozycjonowanie wirtualnej kamery w generowanych filmach i poruszanie tą kamerą w celu uchwycenia obiektów i ludzi z różnych kątów. Google twierdzi również, że Veo 2 może bardziej realistycznie modelować ruch, dynamikę płynów (jak kawa nalewana do kubka) i właściwości światła (takie jak cienie i odbicia). Obejmuje to różne obiektywy i efekty kinowe, mówi DeepMind, a także „zniuansowaną” ekspresję człowieka. To jednak, póki co, tylko teoria. Veo 2 jest dostępny od dziś tylko teoretycznie. W praktyce musimy się zadowolić umieszczonymi na YouTubie przykładami - i żyć w przekonaniu, że podobno takie cuda niebawem i my będziemy mogli generować.