OpenAI, eğitim verilerinde YouTube’u kullandıysa başı ağrıyabilir
YouTube’un CEO’su Neal Mohan, OpenAI’ın Sora’nın eğitiminde YouTube videolarını kullanıp kullanmadığı konusunda ilk elden bilgisi olmadığını söylüyor. Bununla birlikte eğer böyle bir durum varsa, bunun YouTube’un kullanım koşullarının “açık bir ihlali” olacağını da ifade ediyor.
Bu söylemler aslında geçtiğimiz ay OpenAI Baş Teknoloji Sorumlusu Mira Murati’nin bir röportajına atıf olarak algılanabilir. CTO Mira Murati, kendisine yöneltilen soruya Sora’nın YouTube videoları üzerinde eğitilip eğitilmediğinden emin olmadığı cevabını vermişti. Aynı söylemi Facebook ve Instagram için de kullanmıştı. OpenAI’ın en üst teknoloji sorumlusunun eğitim verileri hakkında emin olmaması ise o dönem tartışmalara neden olmuştu.
OpenAI, ChatGPT ve DALL-E gibi popüler yapay zeka modellerini eğitmek için hangi materyalleri kullandığı konusunda bir süredir net davranmıyor. Sora ve diğer üretken yapay zeka araçları, web’deki her türlü ulaşılabilir içerik üzerinde eğitiliyor. Tüm yapay zeka şirketleri mümkün olduğunca çok veri üzerinde modellerini eğitmek istiyorlar. Ancak hemen hemen tüm yapay zeka şirketleri ve girişimleri, eğitim verilerinde “kamuya açık veya lisansı içerikleri kullandık” söylemini kullanıyor. Takdir edersiniz ki bu, çok geniş bir ifade.