Midjourney 6 çıktı! Yapay zeka görsel üretiminde şimdiye kadarki en büyük gelişme

Midjourney v6 kısa bir süre önce çıktı. Yapay zeka görüntü oluşturucunun son sürümü daha gerçekçi görüntüler, ek işlevsellik vaat ediyor ve aracın bazı önemli eksikliklerini gideriyor. Ayrıca yeni bir komut istemi sistemi de getiriliyor. Dolayısıyla deneyimli kullanıcıların da yeni Midjourney’e alışması biraz zaman alabilir. Ancak şimdiye kadar paylaşılan örnekler tek kelimeyle muazzam görünüyor. Benzer haberlerimizde olduğu gibi bu haberdeki görsellerin de tamamı Midjourney tarafından oluşturuldu.

Midjourney 6 ile gelişim çok büyük

Midjourney’in altıncı iterasyonu artık tüm kullanıcılara açık ve sayısız örnekler sosyal medyada yayılmaya şimdiden başladı. Her ne kadar web sitesi beta aşamasında olsa da Midjourney v6’yı kullanmak için halenDiscord’u kullanmak gerekiyor. /image komutundan sonra girdiğiniz istemin/prompt’un sonuna “-v 6” ekleyerek istediğiniz görseli son sürümü kullanarak üretebilirsiniz. Eski sürümler de halen çalışıyor. Yani “-v 5” gibi sürümleri de kullanabilirsiniz. Kullanıcılar ayrıca Midjourney Discord sunucusuna “/settings” yazarak veya sunucunun Midjourney botuna doğrudan bir mesaj gönderip açılır menüden V6’yı seçerek varsayılan sürümü seçebilir. Midjouney’i denemek için buradaki bağlantıyı kullanabilirsiniz.

Midjourney 6 ile gelen yenilikler neler?

Midjourney v6 şimdilik alpha sürümde test ediliyor, yani modelde halen eksiklikler ve kronik hatalar yaşanabilir. Bununla birlikte aşağıdaki yenilikler temel modele eklenmiş:
  • Daha uzun istemlerin yanı sıra çok daha doğru istem takibi
  • Geliştirilmiş tutarlılık ve model bilgisi
  • Geliştirilmiş görüntü istemi ve remix
  • Küçük metin çizim yeteneği. (metninizi “tırnak” içinde yazmalısınız ve –style raw veya daha düşük –stylize değerleri yardımcı olabilir) Örnek: /”Merhaba Dünya!” metninin bir yapışkan not üzerine keçeli kalemle yazılmış bir fotoğrafını hayal edin –ar 16:9 –v 6
  • Hem ‘ince’ hem de ‘yaratıcı’ modlarla geliştirilmiş yükselticiler (Çözünürlüğü 2 kat artırır. U1/U2/U3/U4’e tıkladıktan sonra resimlerinizin altında bunlar için düğmeler göreceksiniz)

Midjourney 6 örnekleri neler söylüyor?

Midjourney v6’nın çıktıları bir Hollywood prodüksiyonundan çıkmış gibi görünüyor. Kullanıcılar, bazıları elle düzenlenmiş çalışmalardan ayırt edilemeyen çok sayıda gerçekçi görüntü yayınlamış durumda. Hatalar hala meydana gelse de, her yeni sürümde bunları bulmak daha uzun sürüyor gibi görünüyor, bu da hem büyüleyici hem de endişe verici.

Bununla birlikte geliştiriciler aracın doğal dil anlayışının geliştiğini iddia ediyor. Dolayısıyla istemler/promptlar artık üslup, konu, ortam, kompozisyon ve diğer unsurlara ilişkin net göstergelere ihtiyaç duyuyor diyebiliriz.

Midjourney v6’nın dikkate değer yeni bir özelliği de okunaklı metin oluşturma yeteneği. Hatırlarsanız Dall-E 3 metin yazma konusunda fena iş çıkarmıyordu ancak Midjourney v6 olayı farklı bir noktaya taşıyor. Daha önceleri, bozuk metinler yapay zeka tarafından oluşturulan görüntülerin ortak bir işaretiydi. Artık kullanıcılar neon tabelalar veya tebeşir gibi çeşitli stillerde metin içeren resimler oluşturabiliyor. Bu gelişme aynı zamanda Midjourney’in McDonald’s veya Coca-Cola gibi tanınmış markaların logolarını doğru bir şekilde yeniden oluşturmasını sağlıyor.

Aşağıdaki görüntü, hem Midjourney’in ne kadar ilerlediğini hem de yapay zeka görüntü üretiminin kalan eksikliklerini gösteren oldukça iyi bir örnek. Leonardo DiCaprio‘nun Vladimir Lenin rolünde oynadığı kurgusal bir Netflix dizisi posterini inandırıcı bir şekilde tasvir ediyor, hatta önceki sürümlerin yapamadığı başlığı ve Netflix logosunu doğru bir şekilde oluşturuyor. Ancak Netflix logosunun konumu ve latince karakterlerde sorun var gibi görünüyor.
Aşağıda arka arkaya bazı kıyaslamalı (v6 vs v5.2) örnekler vereceğiz. Burada iki model arasındaki farkı daha net bir şekilde göreceksinizdir. Ancak halen bazı temel sorunlar da göze çarpıyor. Mesela aşağıda da göreceğiniz üzere her iki modelin de antik Roma pazarı tasvirinde temel bir sorun var. Evet, v6 (üstte) çok daha gerçekçi resmediyor ancak her ikisi de Roma dönemindeki Kolezyum’u harabe şeklinde gösteriyor. Bu, temel ve bağlamsal bir hata.
Bir başka ilginç gelişme de çok panelli görüntüler. Yapay zeka görüntü oluşturucuları, olay dizilerinde görsel sürekliliği sağlama konusunda hala zorluklarla karşılaşsa da Midjourney v6, her biri farklı bir konu veya açı içeren birden fazla panelli bir resim oluşturabiliyor. Hemen alttaki görselde bunu görebilirsiniz.

Örnekler

İstem: “documentary photo of a woman selling pho at a Vietnamese street market, sunset, shot on fujifilm” (v6 üstte, v5.2 altta)

İstem: “gucci meets country” (v5.2 solda, v6 sağda)

İstem: “reflection of a sunset in a rain puddle” (v5.2 solda, v6 sağda)

İstem: “An abstract, surreal landscape with melting clocks, distorted shapes, and floating islands. The color palette is vibrant with a mix of blues, reds, and greens. A large, eye-shaped moon dominates the sky.” (v5.2 solda, v6 sağda)

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir