Nvidia ma pomysł na poprawę jakości wideorozmów
Jednym z nielicznych pozytywnych skutków pandemii jest fakt, że COVID popchnął wiele firm do rozwoju technologii pomagających nam w codziennym życiu. Nvidia pokazuje rozwiązanie, które ma szansę zrewolucjonizować jakość wideorozmów.
Wideorozmowy stały się nieodłączną częścią rzeczywistości korporacyjnej, a do tego spopularyzowały się nawet na gruncie prywatnym. Zoom, Slack, czy Microsoft Teams zyskały nowych użytkowników, a rozmowy wideo na Messengerze czy WhatsAppie są popularniejsze niż kiedykolwiek.
Na przestrzeni ostatnich miesięcy wielokrotnie trafiałem na sytuację, kiedy jakość obrazu podczas videocalla była fatalna. Mam świetne łącze światłowodowe, a wiem, że mój rozmówca również korzysta z szybkiego internetu, ale niekiedy to nie wystarcza. Coś na łączach powoduje zakłócenia.
Pomoże w tym sztuczna inteligencja.
Nowy algorytm Nvidii działa na dwóch poziomach. Z jednej strony potrafi kompresować wideo bez widocznej utraty jakości, a przykłądy producenta robią wielkie wrażenie. Przy kodeku h.264 (będącym dziś standardem) jedna klatka ma 97 KB, a w algorytmie Nvidii klatka obrazu o tej samej jakości ma zaledwie 0,1 KB. Mamy więc redukcję do ok. 0,1 proc. względem początkowego transferu.
Daje to możliwość przesyłania dobrego jakościowo obrazu na bardzo słabych łączach oraz w sytuacjach, kiedy system jest przeciążony liczbą użytkowników. Tak rewelacyjne rezultaty są osiągane poprzez algorytm uczenia maszynowego, który na bieżąco analizuje obraz i dobiera zmienne w kompresji. Algorytm analizuje twarz i dba o to, by najważniejsze elementy (twarz, oczy, usta) zawsze były odpowiednio ostre.
Drugie zastosowanie algorytmu to poprawa jakości wideo poprzez interpolacje obrazu przy wsparciu sztucznej inteligencji. Efekty pokazane przez Nvidię robią ogromne wrażenie. Algorytm analizuje twarz rozmówcy klatka po klatce i wybiera charakterystyczne szczegóły, po czym tworzy sztuczny (lecz wiarygodny) obraz w wyższej rozdzielczości. Im dłużej trwa rozmowa, tym lepsze efekty.
Trzecie zastosowanie przyda się osobom, które podczas wideorozmów pracują nad czymś innym.
Algorytm Nvidii jest w stanie przekształcić twarz w taki sposób, by wydawało się, że rozmówca patrzy wprost do kamerki, nawet jeśli ma skierowaną głowę w nieco innym kierunku. Dotychczas podobne rozwiązania potrafiły korygować pozycję oczu. Nvidia przekłada to na całą twarz, co jest znacznie większym wyzwaniem.
Wszystkie obliczenia niezbędne do działania algorytmów zachodzą w chmurze, dzięki czemu efekty można będzie zobaczyć na komputerach, tabletach, czy smartfonach.
I właśnie takie rozwiązania sprawiają, że praca biurowa w domowych warunkach jest skuteczniejsza i nieco przyjemniejsza. Algorytm na razie jest jeszcze rozwijany wewnętrznie, ale docelowo ma trafić do wszystkich zainteresowanych użytkowników.