Tech / Artykuł

Sztuczna inteligencja Facebooka potrafi odtworzyć przepis kulinarny na podstawie zdjęcia potrawy

Facebook eksperymentuje ze sztuczną inteligencją i sieciami neuronowymi. Właśnie pochwalił się efektem ubocznym tych badań. Jest nim - jak żartuje firma, nawiązując do inżynierii odwrotnej - „gotowanie odwrotne”. 

W telegraficznym skrócie: system Facebooka analizuje zdjęcie potrawy i na jego podstawie tworzy przepis z listą składników i sposobem przygotowania posiłku.

Facebook zaznacza, że na postawie zdjęcia system nie jest oczywiście w stanie zidentyfikować konkretnego rodzaju mąki użytej do pieczenia ciasta czy temperatury smażenia lub pieczenia. Firma mówi, że odtworzony przez AI przepis jest „wiarygodnym przybliżeniem” potrawy, która została sfotografowana.

Jak działa system Facebooka?

W ogromnym uproszczeniu, AI największego serwisu społecznościowego świata wyodrębnia informacje z obrazu. System korzysta z dwóch sieci neuronowych. Pierwsza z nich identyfikuje składniki, druga zajmuje się opracowaniem przepisu.

Inżynierowie Facebooka twierdzą, że ich system różni się od tych, które na podstawie zidentyfikowanego na zdjęciu obiektu, przeszukują sieć w poszukiwaniu właściwego przepisu. Zwracają jednocześnie uwagę na problematyczność identyfikacji żywności na podstawie zdjęcia. Trudność ma polegać na tym, że kształty, rozmiary i inne cechy żywności cechują się dużą zmiennością wewnątrzklasową.

Żeby objaśnić problem, badacze przywołują przykład cebuli:

Cebula może być biała, żółta lub czerwona. Można ją pokroić w talarki, półtalarki lub poszatkować. Możesz ją piec, gotować, dusić, grillować, smażyć lub po prostu zdecydować się jeść ją na surowo. Usmażona cebula będzie półprzezroczysta, ale podsmaż ją w maśle, cukrze i occie balsamicznym, a dostaniesz brązową mannę z nieba: karmelizowaną cebulę - czytamy.

Kolejny problem ma stanowić fakt, że składnik może być niewidoczny w konkretnej potrawie.

Wcześniejsze metody nie były zbyt wyrafinowane i polegały na zrobieniu zdjęcia jedzeniu i wyszukiwaniu wyniku w bazie danych zawierających fotografie gotowych posiłków.

Inżynierowie Facebooka szukali bardziej skutecznej metody. Skorzystali z bazy danych liczącej 17 tys. składników i uprościli ją do 1,5 tys. składników. Ów zbiór liczył też 1 mln przepisów, ale został „odchudzony” do 350 tys. System został nauczony przewidywania, które składniki występują często razem (podano przykład soli i pieprzu czy pomidorów i sera).

Oprócz informacji z obrazu i listy składników zestaw danych dostarcza sieci neuronowej słownictwo składające się z prawie 25 tys. unikalnych słów. Sieć analizuje również wzajemne oddziaływanie między obrazem a składnikami w celu uzyskania informacji na temat przetwarzania żywności tak, by powstała potrawa.

AI Facebooka odtworzyła przepis na paellę.

Facebook opisuje, jak powstał przepis na paellę - danie stosunkowo trudne jeżeli chodzi o dokładną identyfikację składników na podstawie zdjęcia przez AI. Pierwsza sieć neuronowa rozpoznała ryż, cebulę, pomidory i owoce morza, a druga zaczęła generować przepis krok po kroku.

Inżynierowie podkreślają, że system opiera się o trzy rodzaje danych: obraz, listę składników i bazę danych.

Jaki cel ma projekt Facebooka? Firma nie zamierza tworzyć kulinarnego Shazama (aplikacja umożliwiająca rozpoznawanie utworów muzycznych na podstawie ich fragmentów). Podzielił się ubocznym efektem badań nad sztuczną inteligencją. Jedno z pytań, jakie stawiają badacze, można sprowadzić do zagadnienia: jak maszyny widzą i rozumieją świat?

przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst


przeczytaj następny tekst