Sztuczna inteligencja ma wymyślić następcę pliku JPG
Następcę formatu JPG może wymyślić sztuczna inteligencja. Organizacja JPEG wykorzysta uczenie maszynowe do opracowania lepszych metod kompresji.
Organizacja JPEG (Joint Photographic Experts Group) stoi za stworzeniem - nie uwierzycie - formatu JPEG. Od dłuższego czasu szuka wydajniejszych metod kompresji, oraz następcy dla plików .jpg, które zdominowały współczesny internet. Organizacja w 2019 r. zapowiedziała rozpoczęcie prac nad projektem JPEG AI, a teraz, po najnowszym zgrupowaniu w Sydney, zdradza więcej na ten temat.
Sztuczna inteligencja ma pomóc tam, gdzie JPEG się nie sprawdza.
Dotychczas algorytmy sztucznej inteligencji były stosowane w rozpoznawaniu obiektów na zdjęciach, odczytywaniu naturalnego języka mówionego i tym podobnych zastosowaniach. Nic nie stoi jednak na przeszkodzie, by algorytmy AI pomogły w tworzeniu wydajniejszego kodeka obrazu.
AI, czyli de facto uczenie maszynowe, polega przecież na karmieniu algorytmów danymi wsadowymi, na podstawie których algorytm tworzy zadaną treść. Im więcej przerobionych danych, tym lepszy efekt końcowy. Przy odpowiednio dużej bazie danych dochodzimy do momentu, w którym algorytmy uczenia maszynowego są sprawniejsze od dowolnego zespołu ludzi. Mogą niejako przewidywać rezultaty.
Właśnie takie zadanie organizacja JPEG postawiła przed algorytmami. Celem jest stworzenie nowych metod kompresji obrazu, by otrzymać jak najmniejsze pliki graficzne o jak najwyższej jakości.
A co jest nie tak z plikami JPG?
Wydawać by się mogło, że w dzisiejszym świecie rozmiar plików JPG w internecie nie stanowi żadnego problemu. W domach mamy światłowody, a poza domem łączność LTE. W praktyce jednak bywa z tym różnie. Nadal są obszary, do których dociera tylko radiowy sygnał internetowy o okropnej jakości, a pokrycie sieci LTE poza miastami woła o pomstę od nieba.
Poza tym smartfony - choć zaczynają dominować w strukturze internetowego ruchu - nie wyeliminowały desktopów. A na nich korzystamy z monitorów 4K i 5K, a jednocześnie strony mają coraz większe grafiki. Pełnoekranowe zdjęcia są dziś codziennością, a takie pliki w rozdzielczości 4K cały czas zajmują sporo miejsca.
Format JPG nie jest optymalnym rozwiązaniem, z czego zdaje sobie fakt np. Google, które od lat stawia na rozwój WebP charakteryzującego się lepszą wydajnością kompresji. Do tego WebP obsługuje przezroczystości (niczym PNG), jak i ruch (niczym GIF). Mamy więc format „trzy w jednym”.
Pomoc sztucznej inteligencji przy kodekach nie jest zupełną nowością.
Taką metodę pracy zastosował z sukcesami Netflix przy tworzeniu wydajnych kodeków wideo stworzonych na potrzeby strumieniowania materiałów w krajach rozwijających się, w tym głównie w Indiach.
To wszystko brzmi niesamowicie futurystycznie. Nauka doszła do momentu, w których algorytmy są tak potężne, że dosłownie nie sposób ich zrozumieć. Bo - przykładowo - kto zna cały kod stojący np. za wyszukiwarką Google’a? Z pewnością nie jest to jedna osoba, lecz zespół wielu deweloperów pracujących nad poszczególnymi częściami składowymi.
Kto by pomyślał, że te potężne mechanizmy posłużą temu, by strony internetowe ładowały się szybciej.