Piszesz Google'owi co ma zagrać, a on stworzy dla ciebie muzykę. Ruszają zapisy do MusicLM
Pomimo ostatnich kontrowersji Google wróży artystom AI świetlaną przyszłość - i to przede wszystkim artystom muzycznym. Dowodem tego ma być MusicLM, który Google wykastrował z możliwości tworzenia ścieżek inspirowanych innymi twórcami. Jak wyszło? Możecie przekonać się sami w ramach programu testów Google AI Kitchen.
Konferencja Google I/O 2023 już za nami, a gigant zaprezentował sporo nowości. Do tych bardziej spodziewanych możemy zaliczyć otwarcie Barda dla szerszego grona czy prezentacja Google Workspace Duet. Do tych mniej spodziewanych otwarcie zapisów do testów modelu MusicLM.
MusicLM to model sztucznej inteligencji przetwarzający tekst na muzykę (text-to-music). Działa to w podobny sposób co modele text-to-image, które po wpisaniu odpowiedniego promptu wygenerują dowolny obraz. O istnieniu MusicLM było przynajmniej od stycznia, kiedy to Google po raz pierwszy zaprezentował możliwości modelu.
Google otwiera dostęp do MusicLM.
Jednak na dostęp do generatywnej SI musieliśmy czekać długie miesiące, a to za sprawą obaw koncernu o aspekty etyczne i prawa autorskie, gdyż w niektórych wygenerowanych utworach MusicLM dosłownie kopiował ścieżki dźwiękowe utworów, na których był trenowany (sytuacja podobna do tej z modelem Stable Diffusion). Dodatkowo cierpiał on na typowe, spodziewane problemy: niektóre kompozycje brzmiały dziwnie, inne, zawierające wokal nie dało się zrozumieć.
Teraz Google oficjalnie ogłosił możliwość zapisu do zamkniętych testów MusicLM. Wystarczy wejść na stronę Google AI Test Kitchen, zalogować się na konto Google, wypełnić formularz i poczekać na otrzymanie dostępu drogą e-mailową.
Czy jest na co czekać? Według badaczy Google i zaangażowanych w testy modelu artystów, MusicLM może umożliwić twórcom - tak profesjonalnym, jak i aspirującym - tworzenie muzyki w nowy, unikalny sposób. Tak jak w przypadku innych generatywnych modeli, Google zaimplementowało w MusicLM możliwość oceniania efektów pracy modelu poprzez klikanie w "trofea" wyświetlone przy wygenerowanych ścieżkach. Nagradzanie modelu będzie przyczyniać się do jego dalszej nauki i skojarzenia poszczególnych promptów z pożądanymi efektami.
Warto zaznaczyć, że jednym z kompromisów, na jaki Google poszło, by model został udostępniony szerszemu gronu jest wyłączenie możliwości tworzenia muzyki odwołującej się do stylu danego artysty (np. "dubstep Skrillexa") lub do danego wokalu (np. "głos Adele"). Zamiast tego koncern zachęca do wykorzystania w promptach m.in. instrumentów, gatunków muzycznych i nastroju. Póki co MusicLM rozumie jedynie język angielski.