Flux.1 – Midjourney killer, czy kolejny generator obrazów AI? 

Słowo „rewolucja” mocno przejadło się już w branży generatywnej sztucznej inteligencji. Głodni atencji i kapitału deweloperzy co chwilę serwują nam rewolucyjne narzędzia, które ma zmienić nasze życie. Czy w przypadku generatora obrazów Flux.1 jest podobnie?

Flux.1

Na początku sierpnia niemiecka firma Black Forest Labs ujawniła światu Flux.1, czyli open-source’owy generator obrazów. Choć na rynku jest już sporo dobrych narzędzi tego typu, tak oczy całej branży AI skierowane zostały na niemieckie dzieło. W sieci pojawiły się nawet opinie, że Flux.1 jest Midjourney killerem. 

Flux.1 dostępny jest w trzech wersjach: Pro (z dostępem do API), Dev (na licencji niekomercyjnej) oraz Schnell (model 4-krokowej dyfuzji na otwartej licencji Apache2). Dzięki temu każdy użytkownik może sprawdzić możliwości Flux.1 na własną rękę, za pośrednictwem chociażby GitHuba. Mawiają, że za darmo, to i ocet słodki, dlatego postanowiłem przetestować Flux.1 i sprawdzić, czy jest to faktycznie Midjourney killer. Jak wypadły testy? 

Zalety Flux.1, czyli co urzekło mnie w darmowym generatorze obrazów? 

Używanie DALL-E 3 jest maksymalnie intuicyjne, gdyż generujesz obrazy bezpośrednio w oknie czatu. Jednakże każdy, kto zszedł trochę głębiej w króliczą norę grafik AI, wie, że obsługa Midjourney jest o wiele bardziej skomplikowana. W przypadku Flux.1 jedyną barierą może być fakt, że trzeba założyć konto na GitHubie. Kiedy przejdzie się ten krok, to korzystanie z Flux.1 jest bajecznie proste. W okienku prompt wpisujemy… prompt i naszym oczom po zaledwie kilku chwilach pojawia się gotowy obraz.

Do wyboru są także bardziej zaawansowane opcje, w których można ustalić takie szczegóły, jak ratio (format obrazu), czy ilość generowancyh obrazów z jednego prompta (od 1 do 4). 

Jeśli chodzi o prompt cohenerence, czyli zgodność prompta z wynikiem generacji, to jest ona na dość zadowalającym poziomie. Na plus na pewno zasługują detale oraz jakość grafik. Flux.1 bez problemu radzi sobie z dodawaniem do obrazów tekstu i to nawet takiego, którego font będzie napisany białym pędzlem. 

Zadowalająca jest także szybkość generowania grafik, ponieważ jest to zaledwie kilka sekud. W trakcie moich testów Flux.1 najczęściej generował grafiki w przedziale od 6 do 13 sekund. Tak, to diabelnie szybko.

Porównanie Flux.1 z Midjourney

Szumne zapowiedzi, że nowy niemiecki generator grafik, to Midjourney killer, doskonale się klikają. Nie mają jednak nic wspólnego z rzeczywistością, przynajmniej moim zdaniem. Midjourney nadal ma tę przewagę, że jest na rynku już ponad 2 lata i doskonale rozumie kontekst prompta. To oczywiście zasługa tego, że społeczność Midjourney w ciągu 2 lat wygenerowała miliony grafik.

Postanowiłem przetestować oby dwa narzędzia w najprostszy możliwy sposób – zarówno Midjourney, jak i Flux.1 miały wygenerować obrazy z tego samego prompta. Poniżej wrzucam kilka próbek i samodzielnie oceń, czy Flux.1 jest faktyczną rewolucją na rynku generatorów grafik:

Dlaczego Flux.1 ma szansę zaistnieć w świecie generatorów grafik AI? 

Choć Flux.1 nie prezentuje jeszcze tak dobrej jakości, jak Midjourney, tak dzieło niemieckich deweloperów może sporo namieszać na rynku narzędzi do generowania grafik AI. Na uwagę zasługuje techniczny szczegół, ponieważ Flux.1 wykorzystuje innowacyjną „hybrydową architekturę”, która łączy w sobie transformery z technikami dyfuzji. Co więcej, Black Forest Labs nie zamierza osiąść na laurach i już zapowiada prace nad wprowadzeniem do Flux.1 tworzenia krótkich klipów wideo.

Warto pamiętać, że Flux.1 prezentuje doskonale wyglądające grafiki od pierwszych momentów, gdy dostępny jest publicznie. Dla przypomnienia zaznaczę, że Midjourney ma obecnie wersję 6.1 i ukazał się w 2022 roku. Pierwsze wersje tego generatora grafik wypluwały „dzieła”, które bardziej przypominały kubizm, niż fotorealizm.

Flux.1 ma ogromny potencjał i moim zdaniem z marszy detronizuje DALL-E 3. Choć do jakości prezentowanej przez Midjourney jeszcze trochę mu pozostało, to generator od Black Forest Labs ma szansę stać się niedługo godnym konkurentem i jednym z najlepszych generatorów grafik AI dostępnych na rynku. 

Jeremiasz Krok

Redaktor prowadzący hAI Magazine, copywriter i praktyk narzędzi genAI.

Podziel się

Może Cię zainteresować