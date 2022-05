Aby porównać możliwości Imagen z innymi modelami sztucznej inteligencji przetwarzającej tekst na obraz (m.in. DALL-E 2, VQ-GAN+CLIP czy Latent Diffusion Models), naukowcy stworzyli listę 200 fraz, które zostały wprowadzone do każdego z modeli, by wygenerować obrazy. Następnie obrazy wygenerowane na podstawie tych samych fraz zostały przedstawione osobom biorącym udział w eksperymencie, których zadaniem było ocenienie próbek pod względem jakości oraz precyzyjności, z jaką sztuczna inteligencja odtworzyła daną frazę (czyli np. czy obraz z frazy "pies rasy Corgi" przypomina psa, a jeżeli tak to czy przypomina Corgi). Jak twierdzi Google, osoby oceniające wygenerowane obrazy preferują te stworzone przez Imagen - zarówno pod względem jakości jak i dokładności.