Google Gemini tworzy teraz komiksy i lepsze obrazki - poradnik
Google udostępnił nową wersję narzędzia do generowania obrazków. Model Imagen 4 ma tworzyć jeszcze lepsze treści z poleceń tekstowych. Ty też możesz z niego już skorzystać, całkowicie za darmo.

Pod koniec ubiegłego roku informowaliśmy o modelu Imagen 3. To był jak dotąd najlepszy model generowania obrazków od Google’a. Teraz mamy do dyspozycji wersję oznaczoną numerem "4". Model ma być dostępny w dwóch wariantach: zwykłym oraz Ultra. Ten drugi jest droższy w obsłudze i zapewnia jeszcze lepsze efekty. Oba są już dostępne.
Imagen 4 już tu jest. Potęga generowania obrazów prosto od Google’a
Google opisuje Imagen 4 jako sztandarowy model przekształcający tekst na obraz. Rozwiązanie ma być stworzone "do większości zadań" oraz zapewnia znaczną poprawę jakości względem poprzednika, głównie w przypadku generowania tekstu. Firma podaje też koszt wygenerowania jednego obrazka z tym modelem - wynosi on 0,04 dolara.
Jednocześnie dostępny jest też Imagen 4 Ultra. To bardziej precyzyjny, zaawansowany model. Google twierdzi, że rozwiązanie ma sprawdzać się dobrze nawet na tle konkurencyjnych rozwiązań. Nie podaje jednak, o które chodzi. Możemy jednak podejrzewać, że firma ma na myśli DALL-E od OpenAI oraz Midjourney. Ten model jest jednak droższy w działaniu - kosztuje Google 0,06 dolara za jeden obraz.
Firma pokazała kilka przykładów możliwości nowego rozwiązania. Google uważa, że nowy model nie nadaje się jedynie do stworzenia realistycznych obrazków. Usługa ma sprawdzać się też podczas generowania mniej typowych treści - np. pocztówek, a nawet komiksów i mang z panelami. Potrzebne jest tylko dobre polecenie i można tworzyć tak naprawdę wszystko.
Producent zaznacza, iż wszystkie obrazy generowane przez modele Imagen 4 mają zawierać niewidoczny cyfrowy znak wodny. Tak, aby łatwiej odróżniać treści stworzone przez sztuczną inteligencję od zwykłych obrazów, pocztówek, komiksów wykonanych przez człowieka.
Ty też możesz skorzystać z Imagen 4 za darmo. Oto jak to zrobić
Wcześniej wspominałem o kosztach działania usługi, ale są to sumy, które płaci Google. Użytkownik może skorzystać z Imagena 4 na kilka różnych sposobów, ale najprostszym i darmowym będzie chatbot Gemini. Ten jest dostępny zarówno na stronie internetowej gemini.google.com, jak i aplikacji mobilnej stworzonej na smartfony z Androidem oraz iPhone’y. Jak zacząć generować? To proste:
- na początku musimy uruchomić Gemini na smartfonie lub komputerze;
- następnie klikamy pole tekstowe “Zapytaj Gemini”;
- wpisujemy polecenie zaczynające się od “wygeneruj obraz” zawierające opis wymarzonego zdjęcia;
- czekamy chwilę i cieszymy się wynikami.

Do obsługi Imagen 4 oraz Imagen 4 Ultra nie potrzebujemy korzystać z żadnej subskrypcji. Z rozwiązania skorzystamy zupełnie za darmo. Chatbot wybiera wersję modelu w zależności od wydanego polecenia. Jeśli będzie to prosty prompt, najprawdopodobniej wybierze Imagen 4. Wariant z dopiskiem Ultra jest stworzony do zadań wymagających bardzo dokładnego odwzorowania instrukcji.




Powyżej możecie zobaczyć kilka przykładów wygenerowanych obrazków. Tak jak Google zapowiedział, rozwiązanie nie ma problemu z tworzeniem zdjęć z napisami. Bez kłopotu wygenerujemy pocztówki czy komiksy. Oczywiście, wciąż nie jest idealnie - wystarczy tylko spojrzeć na przykład pocztówki z Krakowa, gdzie Bazylika Mariacka zawiera nieistniejąca dodatkową wieżę. Mimo wszystko, dokładnym poleceniem jesteśmy w stanie wyciągnąć z tego naprawdę dobre efekty.
Więcej o sztucznej inteligencji przeczytasz na Spider's Web:
Obrazek główny: JarTee / Shutterstock.com