Midjourney odjeżdża konkurencji. Nowy model, potężne możliwości
Midjourney wypuścił nową wersję swojego modelu generującego obrazy AI, pierwszą od niemal roku, zaledwie tydzień po głośnej premierze narzędzia do tworzenia obrazów OpenAI. Model V7 wprowadza zupełnie nową architekturę i szereg innowacyjnych funkcji.

CEO Midjourney David Holz opisał V7 jako całkowicie odmienną architekturę w poście na platformie X. W ogłoszeniu na Discordzie wyjaśnił, że V7 jest znacznie lepszy w przetwarzaniu promptów tekstowych. Prompty obrazowe wyglądają oszałamiająco, jakość obrazu jest wyraźnie poprawiona z wyśmienitymi teksturami, a spójność ciał, dłoni i różnych obiektów jest znacznie lepsza we wszystkich szczegółach.
V7 to pierwszy model Midjourney z domyślnie włączoną personalizacją. Użytkownicy muszą najpierw przejść proces oceny około 200 obrazów, aby utworzyć swój profil personalizacji Midjourney. Proces ten i tak został znacznie skrócony i obecnie zajmuje około 5 min. Profil ten dostosowuje model do indywidualnych preferencji wizualnych użytkownika i jest brany pod uwagę przy każdym kolejnym użyciu modelu.
Czytaj też:
Innowacyjne funkcje i ulepszenia techniczne

Jedną z najbardziej interesujących nowości w V7 jest tryb Draft (szkic), który umożliwia użytkownikom generowanie obrazów nawet dziesięć razy szybciej przy połowie kosztów standardowej generacji. Chociaż obrazy w trybie Draft mają niższą jakość niż te tworzone w trybie standardowym, można je łatwo ulepszyć i ponownie wyrenderować jednym kliknięciem.
Tryb Draft można aktywować dodając parametr --draft po promptcie. W interfejsie webowym uruchamia on tryb konwersacyjny, który pozwala modyfikować obrazy za pomocą poleceń głosowych - na przykład można poprosić o zmianę zwierzęcia w obrazie lub dostosowanie pory dnia.
Holz wskazuje, że ta funkcja pomaga użytkownikom przemyśleć swoje początkowe pomysły dotyczące obrazów, umożliwiając szybkie prototypowanie i iterację koncepcji.
Dwie prędkości i model ekonomiczny
V7 jest obecnie dostępny w dwóch wariantach prędkości: Turbo i Relax. Zadania w trybie Turbo kosztują dwukrotnie więcej niż standardowe zadanie w V6, natomiast zadania w trybie Draft to połowa ceny V6. Midjourney planuje wkrótce wprowadzić tryb Standard dla V7, który obecnie jest jeszcze w fazie rozwoju.
Według informacji od Midjourney, V7 oferuje znacznie lepsze przetwarzanie promptów tekstowych, wyższą jakość obrazów z wyraźnie lepszymi teksturami oraz większą spójność w przedstawianiu ciał, dłoni i różnych obiektów. Model ma również zapewniać lepsze wsparcie wielojęzyczne.
Obecne ograniczenia V7
Nie wszystkie funkcje Midjourney są jeszcze dostępne dla V7. Skalowanie obrazów, edycja i teksturowanie nadal korzystają z funkcjonalności wcześniejszego modelu V6. Holz zapowiedział, że te funkcje zostaną wprowadzone wkrótce, potencjalnie w ciągu najbliższych dwóch miesięcy.
Midjourney planuje cotygodniowe aktualizacje modelu V7 przez następne 60 dni. Największą nadchodzącą funkcją ma być nowy system referencji postaci i obiektów. Firma planuje również dwutygodniowe wydania nowych funkcji w ciągu najbliższych dwóch miesięcy i będzie angażować swoją społeczność w ustalanie priorytetów przyszłego rozwoju.