Zrobili bota do rozmawiania z botem. To ma więcej sensu niż myślisz
Jak obsługiwać DALL-E? W teorii to proste, wystarczy wpisać to, czego się oczekuje - a narzędzie generuje grafikę. Problem w tym, że użytkownik nie zawsze wie, czego oczekuje. A raczej nie zawsze potrafi to wyrazić. Microsoft ma na to sposób.
Wykorzystując zaawansowaną sztuczną inteligencję, Microsoft Designer umożliwia użytkownikom łatwe generowanie wysokiej jakości obrazów i projektów graficznych, i to dla osób bez specjalistycznych umiejętności graficznych. Dzięki intuicyjnemu interfejsowi użytkownika i inteligentnym algorytmom, Designer może automatycznie sugerować kompozycje, palety kolorów i typografię, które najlepiej pasują do potrzeb projektowych użytkownika.
Jedną z najbardziej imponujących funkcji Microsoft Designer jest jego zdolność do generowania grafik na podstawie opisów tekstowych. Użytkownicy mogą wprowadzić opis tego, co chcieliby stworzyć, a system AI wykorzysta te informacje do wygenerowania serii propozycji graficznych, które można dalej dostosować. Designer wykorzystuje do tego celu DALL-E od OpenAI.
Czytaj też:
Social media stanowią ewidentny dowód na wysoką popularność tego narzędzia - licznie tam pojawiające się grafiki wygenerowane przez Designera (lub Binga czy Copilota) łatwo rozpoznać, bowiem AI od OpenAI zdaje się mieć swój domyślny styl do pewnej tematyki. Użytkownicy wpisują do narzędzia bardzo ogólnikowe prompty, oczekując, że maszyna domyśli się tego, co sobie wyobrazili. Trzeba pisać jak najszczegółowiej - ale kto by tam czytał instrukcje obsługi czy poradniki. Microsoft wpadł więc na inny pomysł.
Co autor mógł mieć na myśli? Designer się domyśli
Nowość odkryłem przypadkiem, próbując wymyślić jakiś chwytliwy obrazek do tekstu o Sygnale Wow. Logując się do aplikacji Designer zauważyłem jednak nowy przycisk – Enhance prompt czyli ulepsz swojego prompta. Od razu na marginesie dodam, że brak tłumaczenia na język polski na przycisku ma pewne wytłumaczenie: nie działa (nic nie robi) po wpisaniu polskiego polecenia. DALL-E (i Designer) i tak najlepiej sobie jednak radzą, gdy pisze się do nich po angielsku.
Wpisałem więc bardzo kiepski z punktu widzenia AI prompt space aliens laughing at puny humans and their wow signal (czyli kosmici nabijający się ze słabowitych ludzi i ich sygnału wow). Dla artysty to może i cenne wskazówki, ale dla AI, która ma rysować bardzo konkretne rzeczy taki prompt jest trudny do interpretacji. Co się więc stało po kliknięciu w Enhance prompt?
A group of aliens are laughing at a group of humans who are trying to communicate with them through a signal. The aliens are tall and have long arms and legs. They are wearing silver suits and have large, black eyes. The humans are small and are wearing white suits. The scene is set in a dark, starry sky. The aliens are laughing so hard that they are holding their stomachs. Czyli Grupa kosmitów śmieje się z grupy ludzi, którzy próbują się z nimi komunikować za pomocą sygnału. Kosmici są wysocy i mają długie ręce i nogi. Noszą srebrne garnitury i mają duże, czarne oczy. Ludzie są mali i noszą białe garnitury. Scena rozgrywa się na ciemnym, rozgwieżdżonym niebie. Kosmici śmieją się tak mocno, że trzymają się za brzuchy.To znacznie lepszy opis.
To drobiazg, zdecydowanie natury działu aktualności drobne, gdyby Spider’s Web taki prowadził. Wydało mi się jednak to nawet nie tyle ciekawe, co dość zabawne. Oto AI, która generuje rzeczy dla generatywnej AI. Przynajmniej odbiorcy są nadal inteligencji niesztucznej.
*Ilustracja otwierająca: Poetra.RH / Shutterstock