Yapay zekanın zayıf karnı
Eğer ChatGPT, Gemini veya diğer sohbet robotlarını kullanmışsanız hiç de azımsanmayacak sıklıkta bu araçların bir şeyler uydurduğunu fark etmişsinizdir. Her ne kadar bunlara zeka diyor olsa da bu sistemler gerçek ve kurgu arasında ayrım yapamazlar. Bu nedenle yaptıkları uydurmaları bir gerçek olarak ifade etmeye meyillidirler.
Tüm bunlar 30 Kasım 2022’de ChatGPT piyasaya çıktığında öğrendiğimiz bir şeydi. Aradan 2 yıl geçmesine rağmen bu bilgiler tam olarak doğru olmaya devam ediyor. Geçtiğimiz yıl firmalar sunumlarında bunun gibi uydurma veya “halüsinasyon” görme eğilimlerine atıfta bulunuyordu. Ancak 2024’te firmalar sanki artık bu uydurma sorunu çözülmüşçesine en kritik alanlara bile üretken yapay zekayı entegre ediyorlar ve artık sorulmadığında halüsinasyon ile ilgili bir şeyler söylemiyorlar.
Geçtiğimiz günlerde popüler yapay zeka arama motoru Perplexity’nin Forbes ve Wired’a ait içerikleri izinsiz olarak özetlediği tespit edilmişti. Yapılan detaylı incelemelerde Perplexity’nin sunmuş olduğu özetlerde hataların olduğu keşfedildi. Yani bu sistemler ona sunduğunuz tek bir kaynağı özetlerken bile hata yapabiliyor. Perplexity konusuna daha önce değinmiştik anacak Wired, bu arama motorunu “saçmalık makinesi” olarak nitelendirmişti.
Benzer şekilde Google’ın yapay zeka destekli araması AI Overview’da da benzer şekilde hatalı sonuçlar gördük. Yapan oldu mu bilinmez ancak Google’ın yapay zekası insanlara taş yemelerini veya peyniri pizzaya tutturmak için yapıştırıcı kullanmalarını tavsiye etti.
Doğruluk, bir olasılıktan ibaret
ChatGPT’nin piyasaya sürülmesinden sonra bu sistemlerin doğruluğu üzerinde pek çok araştırma yaptı. Yapılan bilimsel araştırmalar bu sistemlerin doğruluğu ile ilgili ciddi endişeler ortaya koyuyor. Dediğimiz ve daha önce değindiğimiz gibi; yapay zekalarda herhangi bir zeka bulunmuyor. Bunlar en basit ifadeyle bir “olasılık robotu”. Dolayısıyla kendi başlarına doğrulukla ilgilenmiyorlar ve doğrulukla ilgili gerçek bir kaygı duymadan doğruya uygun görünen metinler üretmek üzere tasarlanmış durumdalar.
Bahsettiğimiz bir şeyleri uydurma, halüsinasyon görme gibi sorunlar ise esasında yapay zekalar nasıl çalışıyor? sorusunun bir cevabı. Bu sistemlerin ortaya koyduğu bu hatalar kendi başlarına basit bir hata değil bu, teknolojinin nasıl çalıştığının bir göstergesi. Daha ileri bir okuma için lütfen bir üstteki içeriğimize göz atınız.
Ancak kısaca özetlemek gerekirse; Gemini veya ChatGPT’ye güç veren büyük dil modelleri (LLM) her bir harften sonra gelecek harfi tahmin etmek üzere kurulmuş bir sistemden ibaret. Bunlar bilgiye dayalı olarak oluşmuyor, hatta kelimelere dayalı bile oluşturulmuyor. İşin içinde bir tahmin, bir olasılık olduğu için de hiçbir şirket modelin aynı soruya her zaman aynı yanıtı vereceğini asla garanti edemiyor.
Öte yandan bu teknolojiye yakın olmayan sıradan insanlar için yapay zeka, sorularını yanıtlayacak, hastalıklarını teşhis edecek ve/veya işlerini ellerinden bir teknoloji olmaya devam ediyor. Yapay zeka şirketleri -açıkça söylemeyi bırakmış olsalar da- doğruluk konusunu irdelemeye ve çözmeye çalışıyor. En basit ancak kesin olmayan çözümlerden birisi modelin boyutunu yani beslendiği veri kütüphanesini ve bu kütüphanenin kaliteli verilerden oluşmasını sağlamak. Milyonlar yerine artık milyar parametreli modellere geçişimiz de bunun bir göstergesi. Ancak en nihayetinden teknolojinin dayandığı şeyde sorun olduğu için çözüme ulaşmak zorlu bir yolculuk olacak.