Nvidia ma pomysł na poprawę jakości wideorozmów
Jednym z nielicznych pozytywnych skutków pandemii jest fakt, że COVID popchnął wiele firm do rozwoju technologii pomagających nam w codziennym życiu. Nvidia pokazuje rozwiązanie, które ma szansę zrewolucjonizować jakość wideorozmów.
![Nvidia poprawi jakość twojej kolejnej wideokonferencji](/_next/image?url=https%3A%2F%2Focs-pl.oktawave.com%2Fv1%2FAUTH_2887234e-384a-4873-8bc5-405211db13a2%2Fspidersweb%2F2020%2F10%2Fnvidia-wideorozmowy.jpg&w=1200&q=75)
Wideorozmowy stały się nieodłączną częścią rzeczywistości korporacyjnej, a do tego spopularyzowały się nawet na gruncie prywatnym. Zoom, Slack, czy Microsoft Teams zyskały nowych użytkowników, a rozmowy wideo na Messengerze czy WhatsAppie są popularniejsze niż kiedykolwiek.
Na przestrzeni ostatnich miesięcy wielokrotnie trafiałem na sytuację, kiedy jakość obrazu podczas videocalla była fatalna. Mam świetne łącze światłowodowe, a wiem, że mój rozmówca również korzysta z szybkiego internetu, ale niekiedy to nie wystarcza. Coś na łączach powoduje zakłócenia.
Pomoże w tym sztuczna inteligencja.
Nowy algorytm Nvidii działa na dwóch poziomach. Z jednej strony potrafi kompresować wideo bez widocznej utraty jakości, a przykłądy producenta robią wielkie wrażenie. Przy kodeku h.264 (będącym dziś standardem) jedna klatka ma 97 KB, a w algorytmie Nvidii klatka obrazu o tej samej jakości ma zaledwie 0,1 KB. Mamy więc redukcję do ok. 0,1 proc. względem początkowego transferu.
Daje to możliwość przesyłania dobrego jakościowo obrazu na bardzo słabych łączach oraz w sytuacjach, kiedy system jest przeciążony liczbą użytkowników. Tak rewelacyjne rezultaty są osiągane poprzez algorytm uczenia maszynowego, który na bieżąco analizuje obraz i dobiera zmienne w kompresji. Algorytm analizuje twarz i dba o to, by najważniejsze elementy (twarz, oczy, usta) zawsze były odpowiednio ostre.
![class="wp-image-1451714"](/_next/image?url=https%3A%2F%2Focs-pl.oktawave.com%2Fv1%2FAUTH_2887234e-384a-4873-8bc5-405211db13a2%2Fspidersweb%2F2020%2F10%2Fnvidia-wideorozmowy-1.jpg&w=1200&q=75)
![class="wp-image-1451717"](/_next/image?url=https%3A%2F%2Focs-pl.oktawave.com%2Fv1%2FAUTH_2887234e-384a-4873-8bc5-405211db13a2%2Fspidersweb%2F2020%2F10%2Fnvidia-wideorozmowy-2.jpg&w=1200&q=75)
Drugie zastosowanie algorytmu to poprawa jakości wideo poprzez interpolacje obrazu przy wsparciu sztucznej inteligencji. Efekty pokazane przez Nvidię robią ogromne wrażenie. Algorytm analizuje twarz rozmówcy klatka po klatce i wybiera charakterystyczne szczegóły, po czym tworzy sztuczny (lecz wiarygodny) obraz w wyższej rozdzielczości. Im dłużej trwa rozmowa, tym lepsze efekty.
Trzecie zastosowanie przyda się osobom, które podczas wideorozmów pracują nad czymś innym.
![class="wp-image-1451720"](/_next/image?url=https%3A%2F%2Focs-pl.oktawave.com%2Fv1%2FAUTH_2887234e-384a-4873-8bc5-405211db13a2%2Fspidersweb%2F2020%2F10%2Fnvidia-wideorozmowy-3.jpg&w=1200&q=75)
Algorytm Nvidii jest w stanie przekształcić twarz w taki sposób, by wydawało się, że rozmówca patrzy wprost do kamerki, nawet jeśli ma skierowaną głowę w nieco innym kierunku. Dotychczas podobne rozwiązania potrafiły korygować pozycję oczu. Nvidia przekłada to na całą twarz, co jest znacznie większym wyzwaniem.
Wszystkie obliczenia niezbędne do działania algorytmów zachodzą w chmurze, dzięki czemu efekty można będzie zobaczyć na komputerach, tabletach, czy smartfonach.
I właśnie takie rozwiązania sprawiają, że praca biurowa w domowych warunkach jest skuteczniejsza i nieco przyjemniejsza. Algorytm na razie jest jeszcze rozwijany wewnętrznie, ale docelowo ma trafić do wszystkich zainteresowanych użytkowników.