Internet zaleją sztuczne filmy. Google wymyślił wideo na nowo
Nadchodzi fala jeszcze lepszych filmów wygenerowanych przez sztuczną inteligencję. Za sprawą Google’a na YouTubie i innych mediach społecznościowych zobaczysz jeszcze więcej treści AI.

Google zapowiedział dziś nowy model generowania wideo nazwany Gemini Omni. Rozwiązanie ma pozwalać nie tylko na tworzenie filmów za pomocą sztucznej inteligencji, tak jak robił to dotychczasowy model Veo 3.1. Oprócz tego pozwoli też edytować istniejące filmy oraz je ulepszać. Wszystko za pomocą prostych poleceń tekstowych.
Google zwiększa realizm generowanych filmów
Gemini zyskał na ogromnej popularności dzięki świetnemu generatorowi zdjęć Nano Banana. Narzędzie pozwala na szybkie tworzenie grafik oraz zmianę stylów za pomocą sztucznej inteligencji. Niedawno twórcy dodali też do narzędzia świetną opcję pozwalającą na wygodną edycję grafik za pomocą znaczników czy rysunków. Teraz przyszedł czas na podobne ulepszenie dla generatora filmów.
Firma ogłosiła dziś wdrożenie Gemini Omni. To multimodalny model sztucznej inteligencji, który jest w stanie stworzyć "wszystko" z dowolnego źródła. Na początku rozwiązanie skupia się jednak na generowaniu materiałów wideo. Dzięki temu narzędziu użytkownik może łączyć zdjęcia, dźwięki, wideo oraz tekst, aby wygenerować pełnoprawne filmy za pomocą sztucznej inteligencji.

Nie trzeba zatem bazować wyłącznie na poleceniu. W celach inspiracji można załączyć zdjęcia, na podstawie których postacie mają zostać ożywione. Rozwiązanie ma jednak działać nieco inteligentniej niż inne modele generowania wideo – model jest w stanie przewidywać, co stanie się później. Tworząc Gemini Omni, twórcy nauczyli go podstawowego rozumienia zasad fizyki (grawitacji, energii kinetycznej, dynamiki płynów), historii, nauki oraz kontekstu kulturowego.
Na wygenerowanych nagraniach powinno się zatem znaleźć mniej nienaturalnych ruchów i elementów, a więc filmy powinny być bardziej realistyczne. Oprócz tego model Omni potrafi łączyć język i obrazy, aby wszystko było ze sobą bardziej spójne. Model jest też w stanie tworzyć wyjaśnienia na podstawie krótkich poleceń użytkownika.
Czytaj też:
Nowy model umie też edytować filmy
Oprócz generowania, Gemini Omni wspiera funkcję edytowania za pomocą poleceń tekstowych. Użytkownik będzie konwersować z AI na temat zmian, które chce wprowadzić do swojego filmu, dzięki czemu można zmienić konkretne rzeczy w materiale.
Dotyczy to również własnoręcznych nagrań wykonanych np. telefonem. Można poprosić, aby sztuczna inteligencja zmieniła sekwencję wydarzeń oraz dodała nowe postacie czy obiekty. Użytkownik jest w stanie zmieniać poszczególne elementy, takie jak kąt nagrywania, styl oraz inne detale, z zachowaniem oryginalnej sceny.

Możliwość edycji profesjonalnej dotyczy także nas samych. Z Gemini Omni można bowiem stworzyć własnego cyfrowego awatara wykorzystywanego w sieci. Wszystkie nagrania wygenerowane przez Omni są oznaczone znakiem wodnym SynthID, a więc będą proste do rozpoznania. Z nowej wersji modelu Gemini Omni Flash może skorzystać każdy posiadacz abonamentu AI Plus, Pro lub Ultra w aplikacji Gemini.



















