Yeni sinir ağı, insan yüzünün hareketlerini ve duygu ifadelerini inanılmaz bir doğrulukla taklit edebiliyor. Bu sayede üretilen videolar son derece doğal ve inandırıcı görünüyor. Uzmanlar bunu deepfake videolar için “korkutucu bir makine” olarak adlandırdılar.
VASA-1, yüz dinamiklerini ve baş hareketlerini üretmek için gizli bir yüz uzayı kullanıyor. Microsoft bu yöntemin, önceki tekniklere kıyasla önemli ölçüde gelişmiş olduğunu ve daha gerçekçi sonuçlar verdiğini belirtiyor. Ortaya çıkan çalışmalar da bunu doğrular nitelikte.
Şimdilik genel kullanıma kapalı
Algoritma, 512×512 piksel çözünürlükte ve saniyede 45 kare hızında çevrimiçi video oluşturmayı destekliyor. Bu da modelle etkileşim kurmayı ve gerçekçi avatarlar ile gerçek zamanlı sohbet etmeyi mümkün kılıyor. Microsoft’un şu anda VASA-1’i ticari bir ürün olarak piyasaya sürme niyeti yok. Şirket yeni modelin şimdilik araştırma amaçlı bir araç olarak kullanılmasını istiyor.
Görünüşe bakılırsa şirket endişeleri yatıştırmak için VASA-1’in yakın zamanda kullanıcıların eline geçmeyeceği konusunda garanti veriyor. Bu model, film ve oyun endüstrisi için yeni imkanlar sunabilir, sanal asistanlar ve müşteri hizmetleri uygulamaları geliştirmek için kullanılabilir ve hatta eğitim ve sağlık sektörlerinde de faydalı olabilir.