REKLAMA

Jak używać Midjourney i jak tworzyć prompty do generowania obrazów? Poradnik krok po kroku

Midjourney to generator obrazów wykorzystujący sztuczną inteligencję oraz uczenie maszynowe. Grafiki, które tworzy na podstawie wpisanego przez użytkownika tekstu, mogą być zarówno surrealistyczne, jak i fotorealistyczne. Jak korzystać z tego narzędzia i jak stworzyć i usprawnić swoje komendy, które są nazywane fachowo promptami? Wyjaśniamy.

midjourney
REKLAMA

Z tego tekstu dowiesz się:

REKLAMA

Midjourney jest narzędziem, które robi prawdziwą furorę w internecie. Sztuczna inteligencja wykorzystująca algorytmy uczenia maszynowego może stworzyć niemal dowolną grafikę na podstawie komend tekstowych.

Wygenerowane treści mogą wyglądać zarówno jak fotorealistyczne zdjęcia, jak i jak abstrakcyjne obrazy, a wszystko zależy od tego, jak skonstruowano polecenie, czyli tzw. prompt. Przygotowaliśmy poradnik, który odpowie na najważniejsze pytania dotyczące tej usługi.

Jak działa Midjourney?

Midjourney tworzy obrazy na podstawie tekstu i działa na podobnej zasadzie, co DALL-E od OpenAI (wykorzystywane w przeglądarce Edge i usłudze Copilot), Stable Diffusion oraz Adobe Firefly. Algorytmy, które przeanalizowały setki milionów grafik znalezionych w internecie, tworzą obrazy odpowiadające zapytaniu (prompt). Użytkownik może wygenerować kolejne grafiki (na podstawie poprzedniego wyniku lub od zera) i poprawić jakość wybranej z nich (upscaling).

Midjourney: poradnik dla początkujących w wersji wideo

Cztery wygenerowane obrazy mogą różnić się zarówno detalami, jak i wyglądać zupełnie inaczej - wszystko zależy od komendy, która została wpisana. Użytkownicy widzą przy tym, niemalże w czasie rzeczywistym, jak obrazy są generowane - co jakiś czas pojawia się nowa migawka pokazująca postęp prac na podstawie. Stworzenie projektu może zajmować ok. 1 minutę w trybie szybkim (fast); w trybie wolnym (relaxed) trwa to niestety wielokrotnie dłużej.

Czytaj inne teksty o generowaniu obrazów przez AI:

Jak korzystać z Midjourney

W przeciwieństwie do wielu innych usług tego typu, twórcy Midjourney nie zdecydowali się z początku na stworzenie od zera aplikacji ani webaplikacji do generowania obrazów. Aby korzystać z usługi, należało użyć… komunikatora Discord. Ten można uruchomić zarówno w przeglądarce internetowej, jak i w aplikacji na popularne desktopowe i mobilne systemy operacyjne, w tym Windows, Android, macOS, iOS. Po założeniu konta należało dołączyć do serwera Midjourney. Na szczęście to się zmieniło. Obecnie można korzystać z Midjourney poprzez stronę internetową midjourney.com.

Ile kosztuje Midjourney?

Usługa jest płatna, więc aby generować swoje obrazy, należy wykupić abonament. Dostępne są cztery różne plany, które można opłacać raz w miesiącu lub zdecydować się na rok z góry, co pozwala oszczędzić 20 proc. na opłatach, a do tego można używać edytora na obrazkach, które wgramy do usługi samemu. Opłaty zaczynają się od 8 dol. miesięcznie przy rozliczeniu rocznym. A jakie dokładnie abonamenty mamy do wyboru i co oferują za większe kwoty?

Oto oferują plany Midjourney Basic, Standard, Pro i Mega:

  1. Midjourney Basic Plan za 10 dol./mies. - 200 minut generowania obrazów w trybie fast, 3 szybkie procesy naraz;
  2. Midjourney Standard Plan za 30 dol./mies. - bez limitów w trybie relax, 15 godzin generowania obrazów w trybie fast, 3 szybkie procesy naraz;
  3. Midjourney Pro Plan za 60 dol./mies. - bez limitów w trybie relax, 30 godzin generowania obrazów w trybie fast, 12 szybkie procesy naraz;
  4. Midjourney Mega Plan za 120 dol./mies. - bez limitów w trybie relax, 60 godzin generowania obrazów w trybie fast, 12 szybkie procesy naraz, możliwość używania trybu stealth;

Co dokładnie oznaczają tryby relax i fast w kontekście Midjourney?

W planach Standard, Pro i Mega można w ramach trybu relax tworzyć dowolną liczbę obrazów, jeśli ustawimy się w kolejce, ale czas tworzenia grafiki będzie wydłużony (do tego nie możemy używać funkcji Max Upscale). Jeśli zależy nam na czasie, możemy skorzystać z trybu fast, który zużywa pakiet, ale ustawia nas na początku kolejki do zasobów serwera. Wedle estymacji minuta wystarcza na stworzenie ok. 60 grafik, więc np. w planie Midjourney Standard możemy wygenerować szybko ok. 900 obrazów. Dodatkowe szybkie godziny można dokupić, jeśli posiadamy już któryś z planów.

midjourney plan basic standard pro mega
Cennik usługi Midjourney i porównanie planów Basic, Standard i Pro

Czym jest tryb stealth w Midjourney?

Domyślnie obrazy, które tworzymy, mogą być przeglądane przez innych użytkowników Midjourney. Jeśli zależy nam na tym, aby nikt nie zobaczyć grafik, które generujemy, trzeba wykupić plan Midjourney Mega. To w nim można aktywować tryb pozwalający na tworzenie grafik po cichu.

A co z Midjourney za darmo?

Przez pewien czas użytkownicy mogli wygenerować ok. 25 obrazów bez opłat po zalogowaniu się do serwera Midjourney w ramach jednego z publicznych kanałów. Wygenerowanie pierwszego obrazu rozpoczynało okres próbny pozwalający na stworzenie kilku grafik. Niestety tę funkcję wyłączono pod koniec marca 2023 r. po kontrowersjach, jakie pojawiły się niedługo po upublicznionego zdjęcia papieża w puchowej kurtce stworzonego w Midjourney.

Wygenerowane z użyciem Midjourney zdjęcie papieża w puchowej kurtce wywołało mnóstwo kontrowersji

Obecnie nie wiadomo, czy i kiedy powróci możliwość generowania obrazów z Midjourney bez opłat oraz darmowy okres próbny. Osoby, które chcą przetestować możliwości, jakie daje tworzenie obrazów z użyciem sztucznej inteligencji i uczenia maszynowego, mogą jednak skorzystać z takich narzędzi jak DALL-E od OpenAI, bazującego na niej modułu w ramach usługi Copilot od Microsoftu oraz Stable Diffusion. Można skorzystać też z Adobe Firefly.

Czym są te cały prompty w kontekście Midjourney?

Mianem promptów określa się komendy wydawane botowi poprzedzone frazą /imagine. To właśnie na ich podstawie algorytmy generują obrazy. A jak powinna być skonstruowana instrukcja? Warto korzystać z komend w języku angielskim, bo jak na razie sztuczna inteligencja Midjourney nie radzi sobie z takimi językami jak polski. Dobrym pomysłem może być przy tym użycie do tłumaczenia polskich poleceń na język angielski Tłumacza Google, usługi ChatGPT itp.

Przykładowe grafiki wygenerowane w Midjourney

W telegraficznym skrócie polecenie powinno opisywać to, co chcemy zobaczyć na ekranie oraz jakiś kontekst. Promptem może być np. „dwoje ludzi na polanie”, „smok w lochu”, „przyjaciele grający w grę planszową w pubie” itp. Najlepsze komendy są jednak znacznie dłuższe oraz bardziej szczegółowe. Możemy zaznaczyć, że polanę powinno oświetlać światło księżyca, smok powinien mieć fioletowy kolor i zionąć ogniem, a pub powinien być oświetlony świecami oraz pełen ludzi.

Jak tworzyć prompty w Midjourney?

Na pierwszy rzut oka tworzenie obrazów w Midjourney wydaje się proste, zwłaszcza jeśli zestawimy ze sobą finalny efekt osiągnięty przez kogoś innego oraz użyty prompt. Niestety w praktyce nie jest to takie łatwe, a narzędzia najłatwiej się nauczyć metodą prób i błędów. Sztuczna inteligencja nie zawsze odgadnie intencje użytkownika, dlatego często trzeba używać synonimów i modyfikować zapytanie z nadzieją, że wstrzelimy się w klucz.

/describe to nowa funkcja Midjourney

Jako część promptu można dodać też obrazek lub zdjęcie - zarówno swoje, jak i znalezione w internecie. W tym celu należy wkleić po poleceniu /imagine link do grafiki. Do tego dochodzi polecenie /blend do łączenia dwóch grafik, a niedawno Midjourney nauczył się nowej sztuczki, czyli polecenia /describe tworzącego prompt na podstawie grafiki. 

Parametry promptów w Midjourney

Oprócz samego tekstu, do promptu można dodać również parametry poprzedzone dwoma myślnikami (--). Przykładowymi parametrami są „--no” (wykluczające z grafiki konkretny obiekt), „--aspect” lub „--ar” (zmieniające proporcje np. na 16:9), „--chaos” (<0-100>; im więcej, tym więcej abstrakcji w wynikach) oraz „--quality” lub „--q” (<.25, .5, 1 lub 2>; zmiana jakości obrazków ma wpływ na zużycie roboczogodzin planu). Takich parametrów jest cała masa.

Do generowania obrazów można wykorzystać różne parametry

Można użyć też innych komend niż /imagine, /blend i /describe. Jedną z nich jest polecenie /info do sprawdzania wykorzystania planu. Do tego dochodzi /settings, które pozwala zmienić różne ustawienia, w tym domyślny silnik Midjourney.

Gdzie szukać inspiracji do tworzenia grafik w Midjourney?

W sieci można znaleźć też dziesiątki poradników dotyczących tego, jak tworzyć prompty dla Midjourneya - zarówno od samych twórców usługi, jak i od artystów i artystów i programistów, którzy z tego narzędzia korzystają od miesięcy. Ogólna zasada jest taka, że powinny one być jak najbardziej szczegółowe. W instrukcji możemy wskazać to co chcemy zobaczyć oraz np. z jakiej perspektywy powinny zostać ukazane obiekty, w jakim stylu powinien zostać wygenerowany obrazek itp.

Użytkownicy usługi Midjourney chętnie dzielą się z innymi poradami

Dobrym pomysłem w szukaniu inspiracji jest oczywiście galeria Midjourney, w której możemy oglądać prace stworzone przez innych użytkowników wraz z użytymi przez nich promptami. Do tego warto przyjrzeć się temu, co udostępniają użytkownicy takich serwisów jak Reddit oraz Twitter poprzez wpisanie w wyszukiwarki Midjourney. Znajomość terminologii używanej w grafice komputerowej oraz fotografii będzie przy tym niezwykle pomocna.

Midjourney a prawa autorskie i prywatność

Na koniec warto dodać, że wykorzystanie komercyjne obrazów wygenerowanych przez Midjourney może być… problematyczne. Płatna wersja Midjourney pozwala robić z obrazami wszystko w granicach prawa, ale rozwój technologii jak zwykle wyprzedza przepisy związane z prawami autorskimi do grafik stworzonych przez sztuczną inteligencję. Do tego do nauki algorytmów wykorzystywano zdjęcia z internetu, więc może dojść do sytuacji, gdy wygenerowana grafika będzie zawierała elementy objęte ochroną prawną.

Zaawansowane ustawienia w Midjourney można wywołać komendą /settings
REKLAMA

Do tego warto wiedzieć o tym, że obrazy wygenerowane przez użytkownika w ramach wymiany prywatnych wiadomości z botem mogą być potem… widoczne dla innych użytkowników. Midjourney proponuje jednak osobom wykupienie wspomnianego planu Midjourney Mega, który pozwala generować „po cichu”, ale i tutaj twórcy nie dają całkowitej gwarancji, że takie wygenerowane grafiki nie trafią do szerszej publiki.

Nie oznacza to jednak, że nie warto z Midjourney korzystać. W uproszczeniu można stwierdzić, że usługa jest dla obrazu tym, czym ChatGPT dla tekstu. To potężne narzędzie, które pozwala szybko wizualizować myśli artystom, co może być pomocne w trakcie burzy mózgów i skraca czas poświęcany na tworzenie makiet. Może też pomóc stworzyć logo, ulotkę, baner, awatar lub ikonę nawet tym osobom, które nie potrafią posługiwać się programami do obróbki grafiki.

Grafika główna to nie zdjęcie, tylko wygenerowany przez Midjourney obraz na podstawie promptu „grownup artist using midjourney on a desktop Apple computer in colorful office, well lit, perspective from behind, photorealistic --ar 24:11 --v 5”.

REKLAMA
Najnowsze
Zobacz komentarze
REKLAMA
REKLAMA
REKLAMA