Metinden videoya dönüştüren yapay zeka sınırlarını aşarak ilerliyor


Halihazırda üretken yapay zeka (AI) modellerinin neredeyse tamamı bir metin girdisinden resim veya yine metin üretiyor. Ancak üretken AI modelleri bir sonraki kilometre taşı olarak ufukta belirmiş durumda. Runway’in Gen-2 olarak adlandırdığı yeni nesil model ile yazdıklarını birkaç saniye içerisinde videoya dönüşüyor.

Metinden videoya yapay zekalar geliyor

Runway’i daha önce hiç duymadıysanız firma, arka plan kaldırma ve poz algılama gibi yapay zeka araçlarında uzmanlaşmış web tabanlı bir video düzenleyici sunuyor. Şirket ayrıca metinden görüntüye AI modeli olan Stable Diffusion‘ın geliştirilmesine yardımcı oldu ve ilk AI video düzenleme modeli Gen-1’i Şubat ayında duyurdu.

Gen-1, mevcut video çekimlerini dönüştürmeye odaklanmıştı ve video girdisini istemde belirtilen kısa bir animasyona çevirebiliyordu. Örneğin üstteki klipte, karton ambalaj görüntüleri endüstriyel bir fabrika görüntüsüyle eşleştirilerek storyboard veya daha gösterişli bir film sunumu için kullanılabilecek bir klip oluşturulmuş.

Sonuçlar büyüleyici

Gen-2 ise sıfırdan video oluşturmaya daha fazla odaklanmış gibi görünüyor, ancak dikkat edilmesi gereken birçok uyarı var. Birincisi, Runway tarafından paylaşılan demo klipler kısa, dengesiz ve kesinlikle fotogerçekçi değil. Ayrıca erişim şimdilik oldukça sınırlı. Denemek isteyen kullanıcılar Runway’in Discord’u aracılığıyla Gen-2 için bir bekleme listesine kaydolmaları gerekiyor. Öte yandan şirket sözcüsü Kelsey Rondenet, Runway’in önümüzdeki haftalarda geniş erişime açılacağını söyledi. Gen-2 ile birlikte stelizasyon, film şeridi, render görüntüleri yapılabildiği gibi metin+resim girdisinden video da yapılabiliyor.

Paylaşılan örnek videolar elbette inanılmaz gerçekçi değil ancak bu örnekler kendi başına “büyüleyici” diyebilirim. Metinden videoya yapay zeka neredeyse sınırsız fırsatlar vadediyor. Elbette diğerlerinde olduğu gibi bu modelin de kötü sonuçları olabilir. Metinden videoya AI araçları üzerinde Meta ve Google gibi devler de çalışıyor ancak görünüşe göre şimdilik onlar ChatGPT benzeri sistemlere odaklanıyorlar. Başka bir deyişle Runway gibi startup’lar, henüz keşfedilmemiş olan metinden videoya alanı da dahil olmak üzere, üretken yapay zeka alanında heyecan verici işler yapmaya devam ediyor. Dilerseniz birkaç örnek ile Runway Gen-2’nin yapabildiklerine bir bakalım.

“Bir gözün yakın çekimi.”

“Bir dağ manzarasının havadan çekimi”

“New York’taki bir dairenin penceresinden gün batımı”

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir