Kazałem Gemini stworzyć muzyczny hit. Efekt jest krępujący

Google wprowadza do Gemini możliwość tworzenia utworów z wokalem. Sprawdzam, czy model Lyria 3 faktycznie komponuje, czy tylko hałasuje.

Oliwier Nytko

18.02.2026 20:00

Kazałem Gemini stworzyć muzyczny hit. Efekt jest krępujący

REKLAMA

Gemini powoli staje się kombajnem, który ma w sobie niemal wszystko. Co to oznacza w praktyce? Mamy tu już generowanie fotorealistycznych grafik, analizę wideo klatka po klatce, pisanie skomplikowanego kodu czy interaktywną naukę języków obcych. Asystent Google przestał być prostym chatbotem tekstowym, a zmienił się w multinarzędzie kreatywne.

Teraz do tego zestawu dołącza brakujący element układanki, czyli dźwięk. Gigant z Mountain View łata ostatnią lukę w swoim ekosystemie, celując w osoby, które chcą tworzyć własne brzmienia bez znajomości nut, instrumentów czy drogiego oprogramowania studyjnego.

REKLAMA

Google wdrożył model Lyria 3, który potrafi wygenerować 30-sekundowe utwory. Nie są to same melodie, ale pełnoprawne kawałki z wokalem i tekstem. Wszystko dzieje się w kilka sekund na podstawie prostych poleceń. Algorytm radzi sobie z interpretacją nie tylko słów, ale i materiałów wizualnych. Możecie wgrać zdjęcie psa z wakacji lub krótki film, a sztuczna inteligencja przeanalizuje nastrój sceny i dobierze do niej odpowiednie brzmienie oraz słowa.

Kontrola stylu i integracja z YouTube

Twórcy zapewniają, że użytkownicy otrzymują większą kontrolę nad stylem i tempem niż w poprzednich wersjach eksperymentalnych. Jeśli napiszecie, że chcecie „nostalgiczny afrobeat o gotowaniu”, model powinien zrozumieć ten kontekst. Dodatkowo do każdego utworu system Nano Banana generuje dedykowaną okładkę, co sprawia, że plik jest gotowy do udostępnienia w mediach społecznościowych.

Google celuje też w twórców internetowych. Lyria 3 trafia do funkcji Dream Track na YouTube Shorts (obecnie w Stanach Zjednoczonych). Pozwala to generować unikalne tła muzyczne do krótkich filmów, co ma kluczowe znaczenie dla utrzymania uwagi widza.

Zamiast szukać darmowych sampli, twórca będzie mógł „zamówić” podkład idealnie pasujący do dynamiki wideo. Firma zadbała o kwestie bezpieczeństwa i praw autorskich. Każdy wygenerowany plik zawiera niewidzialny znak wodny SynthID.

Spider's Web w Google

Google Discover

Pozwala to odróżnić twórczość AI od pracy prawdziwych artystów, a narzędzie ma unikać kopiowania konkretnych wykonawców, traktując ich jedynie jako ogólną inspirację stylową. Użytkownicy mogą też zgłaszać ewentualne naruszenia.

Obecnie funkcja trafia do użytkowników powyżej 18. roku życia w wybranych językach (m.in. angielskim, niemieckim, hiszpańskim i polskim (!)). Początkowo jest dostępna w wersji przeglądarkowej, a wsparcie dla aplikacji mobilnej ma nadejść wkrótce. Subskrybenci płatnych planów mogą liczyć na wyższe limity generowania, choć podstawowa wersja również pozwala na zabawę nowym narzędziem.

Jak wygenerować muzykę w Gemini?

Proces jest maksymalnie uproszczony. Aby stworzyć własny utwór:

Wejdź w czat z Gemini (na razie najlepiej na desktopie).
Wpisz polecenie tekstowe, np. „stwórz piosenkę R&B o psującym się oplu”.
Alternatywnie kliknij ikonę plusa lub obrazka, załadować zdjęcie i poproś o „ścieżkę dźwiękową pasującą do tego widoku”.
Po chwili otrzymasz plik audio wraz z okładką i tekstem piosenki.

Zmarnowałem czas. Ale wiem, co Google tworzy

Mimo głośnych zapowiedzi moje pierwsze zderzenie z Lyrią 3 było bolesne. Efekty są - mówiąc wprost - średnie. To, co czasem wypluwa z siebie algorytm, czasem trudno nazwać muzyką; to raczej kakofonia przypadkowych dźwięków, które system uznał za pasujące do zadanego gatunku. Wokale brzmią płasko, metalicznie i nienaturalnie, jakby robot próbował udawać ludzkie emocje, ale wychodziło mu to karykaturalnie.

W porównaniu do konkurencji, takiej jak Suno czy Udio, propozycja Google wygląda na razie jak wprawka stażysty. Tamte narzędzia potrafią wywołać ciary, tutaj czułem lekkie zażenowanie. Słuchając tych utworów, czułem się, jakbym obcował z wyrobem muzycznopodobnym. Całość przypomina sytuację, w której ktoś wrzuca do blendera najgorsze darmowe sample, dodaje szczyptę autotune'a i losowo wciska przycisk miksowania.

Usłysz sam jeden z moich pierwszych piosenek: gemini.google.com/share/faf307dcacb2

Jednak po spędzeniu z narzędziem dobrych 30 minut, sytuacja zaczyna wyglądać nieco inaczej. Walka z materią i próba wyciśnięcia z tego narzędzia czegokolwiek sensownego przynosi rezultaty. Zmieniając style, poprawiając prompty i eksperymentując z gatunkami, można trafić na ciekawe brzmienia.

Mam nieodparte wrażenie, że Google po prostu wypuściło wersję alfa, byśmy to my, użytkownicy, nauczyli ją grać. Miejscami nie jest źle - trzeba się sporo napracować, ale da się uzyskać intrygujące efekty.

ALE! Trzeba jednak pamiętać, że mamy do czynienia właśnie z cyfrowym pięciolatkiem o gigantycznym potencjale uczenia się. To dopiero początek drogi modelu Lyria 3 w rękach masowego użytkownika.

REKLAMA

Algorytmy potrzebują ogromnej ilości danych i informacji zwrotnej od was, żeby przestać fałszować i gubić rytm. Dajmy temu narzędziu trochę czasu. Podejrzewam, że za kilka miesięcy, po odpowiednim treningu na milionach prób, każdy będzie w stanie wygenerować viralowy hit w stylu Ekipy w kilkanaście minut. Na razie jednak funkcja jest co najwyżej ciekawostką na jeden raz. Jest po prostu meh.

Obrazek wyróżniający został wygenerowany przez Nano Banana.

REKLAMA

Oliwier Nytko

18.02.2026 20:00

Tagi: Gemini Google

Najnowsze

19:10

Operatorzy się dogadali. Połączysz się z dowolną siecią

Aktualizacja: 2026-03-10T19:10:13+01:00