Microsoft tek bir fotoğraftan deepfake video oluşturabilen yapay zeka aracını tanıttı


Microsoft şimdiye kadar gördüğümüz en etkileyici (hatta en ürkütücü) yapay zeka araçlarından birini tanıttı. Yazılım devi tek bir fotoğraf ve ses kaydından yola çıkarak gerçekçi deepfake videolar oluşturabilen VASA-1 adlı yapay zeka modelini ortaya çıkardı.

Yeni sinir ağı, insan yüzünün hareketlerini ve duygu ifadelerini inanılmaz bir doğrulukla taklit edebiliyor. Bu sayede üretilen videolar son derece doğal ve inandırıcı görünüyor. Uzmanlar bunu deepfake videolar için “korkutucu bir makine” olarak adlandırdılar.

VASA-1, yüz dinamiklerini ve baş hareketlerini üretmek için gizli bir yüz uzayı kullanıyor. Microsoft bu yöntemin, önceki tekniklere kıyasla önemli ölçüde gelişmiş olduğunu ve daha gerçekçi sonuçlar verdiğini belirtiyor. Ortaya çıkan çalışmalar da bunu doğrular nitelikte.

Şimdilik genel kullanıma kapalı

Algoritma, 512×512 piksel çözünürlükte ve saniyede 45 kare hızında çevrimiçi video oluşturmayı destekliyor. Bu da modelle etkileşim kurmayı ve gerçekçi avatarlar ile gerçek zamanlı sohbet etmeyi mümkün kılıyor. Microsoft’un şu anda VASA-1’i ticari bir ürün olarak piyasaya sürme niyeti yok. Şirket yeni modelin şimdilik araştırma amaçlı bir araç olarak kullanılmasını istiyor.

Görünüşe bakılırsa şirket endişeleri yatıştırmak için VASA-1’in yakın zamanda kullanıcıların eline geçmeyeceği konusunda garanti veriyor. Bu model, film ve oyun endüstrisi için yeni imkanlar sunabilir, sanal asistanlar ve müşteri hizmetleri uygulamaları geliştirmek için kullanılabilir ve hatta eğitim ve sağlık sektörlerinde de faydalı olabilir.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir