Spotify wyciąga dłoń do wszystkich tych, którzy chcą opublikować audiobooka, ale nie stać ich na lektora
Spotify szeroko otworzyło drzwi osobom, które chcą publikować audiobooki generowane przez AI. Szwedzka firma "mocno wierzy w moc ludzkiej narracji", lecz AI jest po prostu tańsza.

W 2022 roku Spotify umożliwiło udostępnianie i odsłuchiwanie w serwisie audiobooków. Choć usługa spadła z nieba amatorom słuchania książek i autorom próbującym dotrzeć ze swoimi publikacjami do mas, to nadal nie rozwiązuje ona jednego dużego problemu - konieczności znalezienia i opłacenia lektora, który przeczyta i nagra audiobooka.
Spotify może zostać zalane audiobookami czytanymi przez wirtualnych lektorów
Spotify chce rozwiązać tę kwestię - i przy okazji przyciągnąć na platformę więcej autorów poprzez partnerstwo z ElevenLabs. Spotify zapowiedziało, że od 20 lutego zacznie akceptować audiobooki nagrane przy użyciu oprogramowania ElevenLabs, gdyż szwedzka firma "dostrzega potencjał cyfrowej narracji głosowej do rozwoju i rozszerzenia rynku audiobooków". ElevenLabs to amerykański startup założony przez dwóch polskich inżynierów, który zajmuje się tworzeniem syntezatorów mowy i tworzeniem technologii przetwarzających tekst na mowę.
Jak zastrzega serwis The Verge, audiobooki nagrane przez sztuczną inteligencję zamiast ludzkiego lektora były już dozwolone przez Spotify. Jednak ich udostępnianie wiązało się z kilkoma ograniczeniami.
Platforma dystrybucji audiobooków Spotify, Findaway Voices, akceptuje audiobooki nagrane przez AI tylko od "określonych partnerów" i wymaga, aby każde nagranie zostało poddane weryfikacji przed publikacją. Podjęcie współpracy z ElevenLabs, obecnie prawdopodobnie najbardziej rozpoznawalnym dostawcą usług generowania syntetycznych, lecz ludzko brzmiących nagrań, może doprowadzić do dużego wzrostu publikacji "czytanych" przez AI na Spotify.
Spotify zastrzegło, że choć "mocno wierzy w moc ludzkiej narracji", to dopuszczenie na platformie audiobooków "czytanych" przez AI "jest opłacalnym sposobem na tworzenie wysokiej jakości audiobooków".
ElevenLabs oferuje generowanie głosu w 29 językach, wraz z szeroką gamą głosów do wyboru. Darmowa wersja oprogramowania zapewnia jedynie 10 minut zamiany tekstu na głos miesięcznie. By wygenerować audiobooka, autorzy będą musieli sięgnąć po najdroższy wariant subskrypcji ElevenLabs - kosztujący 99 dol. (ok. 393 zł) miesięcznie abonament Pro, który pozwala na wygenerowanie maksymalnie 500 minut głosu.
Spotify udostępniło możliwość odsłuchiwania audiobooków już w 2022 roku, jednak opcja ta wciąż nie jest dostępna w Polsce.
Więcej na temat Spotify:
Zdjęcie główne: Fabio Principe / Shutterstock