Podoba ci się automatyczny dubbing na YouTube? Idą jeszcze dalej
YouTube eksperymentuje z automatycznymi napisami i tłumaczeniami, ale Microsoft postanowił podnieść poprzeczkę jeszcze wyżej. Przeglądarka Edge będzie dubbingować wszystkie filmy, z dowolnego źródła.

W najnowszej testowej wersji przeglądarki Edge na Windowsa 11 znalazła się funkcja AI Audio Translation, która pozwala na automatyczne tłumaczenie i dubbingowanie wideo, wymagając jednak solidnej porcji pamięci RAM - aż 12 GB. Przyjrzyjmy się bliżej tej ciekawostce.
AI Audio Translation – jak to działa?
Nowa funkcja w Microsoft Edge opiera się na zaawansowanych modelach sztucznej inteligencji zdolnych do rozpoznawania mowy, tłumaczenia na inne języki oraz syntezy naturalnie brzmiącego głosu. Cały proces odbywa się lokalnie na komputerze użytkownika, co teoretycznie poprawia bezpieczeństwo danych i prywatność.
Czytaj też:
Jednak nie ma róży bez kolców - cała operacja jest niezwykle zasobożerna. Microsoft rekomenduje co najmniej 12 GB RAM, aby proces tłumaczenia i generowania głosu nie powodował drastycznego spadku wydajności systemu. Dla wielu z nas korzystających z wielozadaniowych stacji roboczych lub gamingowych potworów nie będzie to problem, ale w przypadku starszych laptopów i urządzeń budżetowych może się to okazać barierą nie do przeskoczenia.
Zalety automatycznego dubbingu? Edge dubbinguje wszystkie wideo, nie tylko YouTube’a
Przede wszystkim: dostępność. Obcojęzyczne materiały wideo stanowią ogromną część treści na YouTube, a automatyczny dubbing eliminuje potrzebę generowania napisów. Dla widzów jest to wygodne rozwiązanie, zwłaszcza podczas oglądania dynamicznych materiałów - kursów online, prezentacji produktowych czy wideoblogów technologicznych.
Po drugie: oszczędność czasu dla twórców. Zamiast ręcznego nagrywania wersji językowych w profesjonalnym studiu wystarczy wgrać ścieżkę dźwiękową w oryginalnym języku i zlecić AI wykonanie reszty. Oszczędzone zasoby finansowe i czasowe można przeznaczyć na dalszy rozwój kanału czy doszlifowanie treści.

Każda nowa technologia ma jednak swoje słabości. W przypadku AI Audio Translation najwięcej kontrowersji budzi kwestia jakości dubbingu. Mimo że syntetyczne głosy stają się coraz bardziej przekonujące nadal nie jest to zestawialne z pracą prawdziwych lektorów, zwłaszcza jeśli chodzi o emocjonalne niuanse i intonację.
Kolejna bolączka to wspomniane zasobożerne wymagania. Użytkownicy z 8 GB RAM w laptopie odczują przycięcia, a nawet niestabilność przeglądarki. W praktyce oznacza to, że część odbiorców będzie musiała zainwestować w rozbudowę pamięci lub kupić mocniejszy sprzęt, aby cieszyć się płynnym działaniem tej funkcji.
Niestety nie mogłem tego jeszcze przetestować. Funkcja na dziś nie obsługuje języka polskiego, jest dostępna w przeglądarce Edge wyłącznie w kanale Canary, na dodatek testy odbywają się metodą A/B - niestety nie zostałem wylosowany. Obawiam się jednak, że z uwagi na wymogi sprzętowe pozostanie ona jeszcze długo w eksperymentalnej fazie. Byłoby szkoda, bo brzmi, nomen omen, bardzo użytecznie.