REKLAMA

Jak używać Midjourney i jak tworzyć prompty do generowania obrazów? Poradnik krok po kroku

Midjourney to generator obrazów wykorzystujący sztuczną inteligencję oraz uczenie maszynowe. Grafiki, które tworzy na podstawie wpisanego przez użytkownika tekstu, mogą być zarówno surrealistyczne, jak i fotorealistyczne. Jak korzystać z tego narzędzia i jak stworzyć i usprawnić swoje komendy, które są nazywane fachowo promptami? Wyjaśniamy.

15.04.2023 05.48
midjourney
REKLAMA

Midjourney jest narzędziem, które robi prawdziwą furorę w internecie. Sztuczna inteligencja wykorzystująca algorytmy uczenia maszynowego może stworzyć niemal dowolną grafikę na podstawie komend tekstowych.

Wygenerowane treści mogą wyglądać zarówno jak fotorealistyczne zdjęcia, jak i jak abstrakcyjne obrazy, a wszystko zależy od tego, jak skonstruowano polecenie, czyli tzw. prompt. Przygotowaliśmy poradnik, który odpowie na najważniejsze pytania dotyczące tej usługi.

REKLAMA

Jak działa Midjourney?

Midjourney tworzy obrazy na podstawie tekstu i działa na podobnej zasadzie, co DALL-E od OpenAI (wykorzystywane w przeglądarce Edge i usłudze Bing Chat), Stable Diffusion oraz Adobe Firefly. Algorytmy, które przeanalizowały setki milionów grafik znalezionych w internecie, tworzą cztery obrazy odpowiadające zapytaniu (prompt). Użytkownik może wygenerować kolejne cztery grafiki (na podstawie jednego wyniku lub od zera) i poprawić jakość wybranej z nich (upscaling).

Midjourney: poradnik dla początkujących w wersji wideo

Cztery wygenerowane obrazy mogą różnić się zarówno detalami, jak i wyglądać zupełnie inaczej - wszystko zależy od komendy, która została wpisana. Użytkownicy widzą przy tym, niemalże w czasie rzeczywistym, jak obrazy są generowane - co jakiś czas pojawia się nowa migawka pokazująca postęp prac na podstawie. Stworzenie projektu może zajmować ok. 1 minutę w trybie szybkim (fast); w trybie wolnym (relaxed) trwa to niestety wielokrotnie dłużej.

Ile kosztuje Midjourney i do czego użytkownikom potrzebny jest Discord?

W przeciwieństwie do wielu innych usług tego typu, twórcy Midjourney nie zdecydowali się na stworzenie od zera aplikacji ani webaplikacji do generowania obrazów. Aby korzystać z usługi, należy użyć… komunikatora Discord. Ten można uruchomić zarówno w przeglądarce internetowej, jak i w aplikacji na popularne desktopowe i mobilne systemy operacyjne, w tym Windows, Android, macOS, iOS. Po założeniu konta należy dołączyć do serwera Midjourney np. ze strony usługi.

midjourney interfejs discord bot prompt
Tak wygląda Discord, czyli komunikator pełniący rolę interfejsu usługi Midjourney

Po wejściu na serwer Midjourney należy też wykupić abonament, bo dostęp do usługi jest płatny. Podstawowy plan, czyli Midjourney Basic, kosztuje równowartość 8 dol. miesięcznie (plus podatek). W jego ramach użytkownicy mogą wygenerować do 200 grafik miesięcznie i realizować 3 zadania w trybie szybkim naraz. Dla wielu osób plan Midjourney Basic będzie wystarczający, ale osoby o większych wymaganiach powinny zainteresować się planem Midjourney Standard.

Midjourney Basic, Standard i Pro - jakie są różnice między planami?

Midjourney Standard kosztuje równowartość 24 dol. miesięcznie (plus podatek). W jego ramach również można generować trzy projekty naraz, ale nie ma limitu liczby wygenerowanych obrazów w trybie wolnym. Do tego można skorzystać z trybu szybkiego przez „15 godzin czasu pracy serwerów”. Jedna godzina pracy serwera pozwala wygenerować ok. 60 grafik, co daje w planie Midjourney Standard łącznie ok. 900 obrazów. Do tego dochodzi dowolna liczba projektów w trybie wolnym.

Cennik usługi Midjourney i porównanie planów Basic, Standard i Pro

Oprócz tego dostępny jest abonament Midjourney Pro za równowartość 48 dol. (plus podatek), który pozwala na wygenerowanie ok. 1800 obrazów miesięcznie oraz realizować do 12 szybkich projektów jednocześnie. W razie gdyby była potrzeba wygenerowania większej liczby obrazów w okresie rozliczeniowym, można w każdym z planów dokupić dodatkowe kredyty (ok. 60 obrazów za 4 dol. + podatek). Więcej o różnicach między planami Midjourney można przeczytać na stronach pomocy.

A co z Midjourney za darmo?

Przez pewien czas użytkownicy mogli wygenerować ok. 25 obrazów bez opłat po zalogowaniu się do serwera Midjourney w ramach jednego z publicznych kanałów. Wygenerowanie pierwszego obrazu rozpoczynało okres próbny pozwalający na stworzenie kilku grafik. Niestety tę funkcję wyłączono pod koniec marca 2023 r. po kontrowersjach, jakie pojawiły się niedługo po upublicznionego zdjęcia papieża w puchowej kurtce stworzonego w Midjourney.

Wygenerowane z użyciem Midjourney zdjęcie papieża w puchowej kurtce wywołało mnóstwo kontrowersji

Obecnie nie wiadomo, czy i kiedy powróci możliwość generowania obrazów z Midjourney bez opłat oraz darmowy okres próbny. Osoby, które chcą przetestować możliwości, jakie daje tworzenie obrazów z użyciem sztucznej inteligencji i uczenia maszynowego, mogą jednak skorzystać z takich narzędzi jak DALL-E od OpenAI, bazującego na niej modułu w ramach Bing Chat i Stable Diffusion. Można obecnie zapisać się też do beta testów usługi Adobe Firefly.

Czym są te cały prompty w kontekście Midjourney?

Mianem promptów określa się komendy wydawane botowi poprzedzone frazą /imagine. To właśnie na ich podstawie algorytmy generują obrazy. A jak powinna być skonstruowana instrukcja? Warto korzystać z komend w języku angielskim, bo jak na razie sztuczna inteligencja Midjourney nie radzi sobie z takimi językami jak polski. Dobrym pomysłem może być przy tym użycie do tłumaczenia polskich poleceń na język angielski Tłumacza Google, usługi ChatGPT itp.

Przykładowe grafiki wygenerowane w Midjourney

W telegraficznym skrócie polecenie powinno opisywać to, co chcemy zobaczyć na ekranie oraz jakiś kontekst. Promptem może być np. „dwoje ludzi na polanie”, „smok w lochu”, „przyjaciele grający w grę planszową w pubie” itp. Najlepsze komendy są jednak znacznie dłuższe oraz bardziej szczegółowe. Możemy zaznaczyć, że polanę powinno oświetlać światło księżyca, smok powinien mieć fioletowy kolor i zionąć ogniem, a pub powinien być oświetlony świecami oraz pełen ludzi.

Jak tworzyć prompty w Midjourney?

Na pierwszy rzut oka tworzenie obrazów w Midjourney wydaje się proste, zwłaszcza jeśli zestawimy ze sobą finalny efekt osiągnięty przez kogoś innego oraz użyty prompt. Niestety w praktyce nie jest to takie łatwe, a narzędzia najłatwiej się nauczyć metodą prób i błędów. Sztuczna inteligencja nie zawsze odgadnie intencje użytkownika, dlatego często trzeba używać synonimów i modyfikować zapytanie z nadzieją, że wstrzelimy się w klucz.

/describe to nowa funkcja Midjourney

Jako część promptu można dodać też obrazek lub zdjęcie - zarówno swoje, jak i znalezione w internecie. W tym celu należy wkleić po poleceniu /imagine link do grafiki (w ramach Discorda można najpierw wysłać obrazek w osobnej wiadomości do bota, a potem skopiować jego URL). Do tego dochodzi polecenie /blend do łączenia dwóch grafik, a niedawno Midjourney nauczył się nowej sztuczki, czyli polecenia /describe tworzącego prompt na podstawie grafiki. 

Parametry promptów w Midjourney

Oprócz samego tekstu, do promptu można dodać również parametry poprzedzone dwoma myślnikami (--). Przykładowymi parametrami są „--no” (wykluczające z grafiki konkretny obiekt), „--aspect” lub „--ar” (zmieniające proporcje np. na 16:9), „--chaos” (<0-100>; im więcej, tym więcej abstrakcji w wynikach) oraz „--quality” lub „--q” (<.25, .5, 1 lub 2>; zmiana jakości obrazków ma wpływ na zużycie roboczogodzin planu). Takich parametrów jest cała masa.

Do generowania obrazów można wykorzystać różne parametry

Podczas rozmów z botem na Discordzie można użyć też innych komend niż /imagine, /blend i /describe. Jedną z nich jest polecenie /info do sprawdzania wykorzystania planu. Do tego dochodzi /settings, które pozwala zmienić różne ustawienia, w tym domyślny silnik Midjourney v4 na starszy lub testową wersję Midjourney v5 (potem można też jednorazowo nadpisać ten wybór parametrem „--v 4”, by wygenerować obrazek z użyciem poprzedniej, bardziej stabilnej wersji).

Gdzie szukać inspiracji do tworzenia grafik w Midjourney?

W sieci można znaleźć też dziesiątki poradników dotyczących tego, jak tworzyć prompty dla Midjourneya - zarówno od samych twórców usługi, jak i od artystów i artystów i programistów, którzy z tego narzędzia korzystają od miesięcy. Ogólna zasada jest taka, że powinny one być jak najbardziej szczegółowe. W instrukcji możemy wskazać to co chcemy zobaczyć oraz np. z jakiej perspektywy powinny zostać ukazane obiekty, w jakim stylu powinien zostać wygenerowany obrazek itp.

Użytkownicy usługi Midjourney chętnie dzielą się z innymi poradami

Dobrym pomysłem w szukaniu inspiracji jest oczywiście serwer Discord usługi Midjourney, gdzie możemy oglądać prace stworzone przez innych użytkowników wraz z użytymi przez nich promptami. Do tego warto przyjrzeć się temu, co udostępniają użytkownicy takich serwisów jak Reddit oraz Twitter poprzez wpisanie w wyszukiwarki Midjourney. Znajomość terminologii używanej w grafice komputerowej oraz fotografii będzie przy tym niezwykle pomocna.

Midjourney a prawa autorskie i prywatność

Na koniec warto dodać, że wykorzystanie komercyjne obrazów wygenerowanych przez Midjourney może być… problematyczne. Płatna wersja Midjourney pozwala robić z obrazami wszystko w granicach prawa, ale rozwój technologii jak zwykle wyprzedza przepisy związane z prawami autorskimi do grafik stworzonych przez sztuczną inteligencję. Do tego do nauki algorytmów wykorzystywano zdjęcia z internetu, więc może dojść do sytuacji, gdy wygenerowana grafika będzie zawierała elementy objęte ochroną prawną.

Zaawansowane ustawienia w Midjourney można wywołać komendą /settings
REKLAMA

Do tego warto wiedzieć o tym, że obrazy wygenerowane przez użytkownika w ramach wymiany prywatnych wiadomości z botem mogą być potem… widoczne dla innych użytkowników Discorda. Midjourney proponuje jednak osobom, które opłacają plan Midjourney Pro, dokupienie dodatkowej usługi pozwalającej na generowanie obrazów „po cichu”, ale i tutaj twórcy nie dają całkowitej gwarancji, że takie wygenerowane grafiki nie trafią do szerszej publiki.

Nie oznacza to jednak, że nie warto z Midjourney korzystać. W uproszczeniu można stwierdzić, że usługa jest dla obrazu tym, czym ChatGPT dla tekstu. To potężne narzędzie, które pozwala szybko wizualizować myśli artystom, co może być pomocne w trakcie burzy mózgów i skraca czas poświęcany na tworzenie makiet. Może też pomóc stworzyć logo, ulotkę, baner, awatar lub ikonę nawet tym osobom, które nie potrafią posługiwać się programami do obróbki grafiki.

Grafika główna to nie zdjęcie, tylko wygenerowany przez Midjourney obraz na podstawie promptu „grownup artist using midjourney on a desktop Apple computer in colorful office, well lit, perspective from behind, photorealistic --ar 24:11 --v 5”.

REKLAMA
Najnowsze
REKLAMA
REKLAMA
REKLAMA