Tech  / Artykuł

Hej, Google - przeczytaj mi to! Asystent Google przeczyta nam internet na głos

Nie masz czasu na czytanie? Google zrobi to za ciebie. Od teraz Asystent Google może przeczytać ci na głos strony internetowe.

Któż dziś ma czas na czytanie artykułów. W naszym zabieganym społeczeństwie stać nas co najwyżej na przejrzenie wzrokiem nagłówków i zostawienie hejterskiego komentarza pod tekstem bez wgłębiania się w treść.

Wzrost popularności podcastów i audiobooków pokazuje jednak, że gdy nie możemy skupić naszych gałek ocznych na ekranach smartfonów, to nagle znajdujemy czas na to, by treści czytane… odsłuchać.

I tutaj wchodzi Asystent Google, cały na biało.

Google właśnie rozpoczął wdrażanie zapowiadanej na początku tego roku funkcji – czytania stron internetowych na głos.

Wystarczy prosta komenda „Hej, Google – przeczytaj to”, by Asystent odczytał nam treść danej witryny. Nie masz czasu przeczytać artykułu? Google przeczyta go na głos, podczas gdy ty będziesz prowadził samochód, mył naczynia czy sprzątał mieszkanie.

Nie jest sprecyzowane, czy funkcja ta będzie dostępna w Polsce. Mowa tylko o „42 językach”, ale zważywszy na to, jak popularny stał się Asystent Google w Polsce, byłbym wielce zdziwiony, gdyby tak się nie stało. Wskazuje zresztą na to lista dostępnych języków do przetłumaczenia treści, którą widzimy na filmie promującym nową funkcję.

Asystent Google przeczyta strony internetowe

Jak mówią przedstawiciele Google’a w załączonym wyżej wideo, twórcy nowej funkcji włożyli sporo pracy w to, aby Asystent nie tylko robotycznie odczytał dany artykuł, ale przyłożył się też do dynamiki i intonacji. Wykorzystując uczenie maszynowe i sieci neuronowe Asystent Google będzie się uczył jak najlepiej interpretować znaki interpunkcyjne i strukturę treści, by z biegiem czasu brzmieć jak najbardziej naturalnie.

Zważywszy na to, jak ogromne zasoby Google może wykorzystać do uczenia Asystenta, przeczuwam zbliżający się przełom w jakości tej technologii...

Asystent-lektor pozwala też kontrolować szybkość czytania, jak w aplikacjach do słuchania podcastów i audiobooków.

Nowa funkcja dopiero trafia do pierwszych użytkowników, więc może minąć trochę czasu, nim pojawi się na wszystkich smartfonach.

Czytanie artykułów na głos to rewelacyjne rozwiązanie. Widzę tylko jeden potencjalny problem.

Widzicie, korzystam z bardzo podobnej funkcji w aplikacji Pocket. Zapisane na później artykuły mogę nie tylko przeczytać, ale i odsłuchać przy użyciu funkcji Text to Speech (TTS).

Funkcja ta działa w Pockecie wyśmienicie, głównie za sprawą… wykastrowania z treści wszelkich grafik i reklam. Artykuł widziany w tzw. „widoku artykułu” jest czystą, pozbawioną przeszkadzajek treścią, dlatego TTS nie ma problemu z jej odczytaniem.

Wiemy natomiast, że zwykłe witryny nie wyglądają tak przejrzyście. Pomijając nawet reklamy, do treści dochodzi też mnóstwo zdjęć, które zwykle posiadają opisy dedykowane osobom niedowidzącym. Jestem bardzo ciekaw, czy Asystent Google’a będzie domyślnie odczytywał te opisy alternatywne, które choć są bardzo istotne dla osób niedowidzących, tak mogą przeszkadzać w trakcie regularnego czytania.

Kolejnym potencjalnym problemem są popularne w wielu miejscach bloki cytatu, dublujące treść artykułu w formie wizualnego wyróżnika. Pocket, dla przykładu, czyta te bloki jak zwykłą treść, powtarzając to, co już przeczytaliśmy.

Jestem ogromnie ciekawy, jak Google – korzystając ze wszystkich swoich zasobów, sztucznej inteligencji i sieci neuronowych – poradzi sobie z tymi potencjalnymi przeszkodami, by dostarczyć nam jak najlepiej brzmiącego lektora, czytającego internet na głos.

Sama perspektywa jest bowiem więcej niż ekscytująca.

Przyszłością konsumpcji treści jest głos, mało kto ma co do tego wątpliwości. Wyobraźmy sobie więc teraz, że każdy portal musi przygotowywać swoje treści w dwóch formatach: tekstowym i głosowym. Najwięksi gracze na świecie już tak robią i mówią wprost, że jest to niesamowicie kosztowne i czasochłonne.

Rozwiązanie takie, jak lektor wbudowany w Asystenta Google, kompletnie likwiduje ten problem. Treść powstaje raz – jako tekst. A to, w jaki sposób czytelnik ją skonsumuje, zależy już tylko od niego. Rewelacja!

Tymczasem zostaje nam poczekać, aż funkcja trafi do Polski. Gdy tak się stanie, na pewno przyjrzymy się jej z bliska.

przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst