Son birkaç yılda insanlık, tüm tarih boyunca toplanan verinin toplamından daha fazla veri üretti ve görünüşe bakacak olursak bu, daha da katlanarak büyümeye devam edecek. Tabii hal böyle olunca da bir noktada herkesin aklına tek bir soru geliyor: Bu kadar bilgiyi nerede saklayacağız?
Her ne kadar bilim insanları, insanlığa ait verileri saklamak adına sabit disk boyutlarını devamlı olarak artırsa ve hatta bazıları bunun sonsuza kadar yapılabileceğine insansa da, üstün veri üretme hızımızın yanında bu çabaların yetersiz kalacağına inanan bir kısım bulunuyor. Bu endişeye karşılık olarak bilim adamları şimdi de ‘eşsiz’ bir çözüm üretmeye çalışıyor: Dosyaları, fotoğrafları ve belgeleri doğanın kendine has veri tabanında, yani DNA’da depolamak.
Birkaç petabayt bilgiyi depolamak için sadece bir gram DNA yeterli
Geçtiğimiz ay Nano Letters isimli bilim dergisinde yayımlanan çalışmanın, DNA veri depolama konseptini büyük boyutlara taşıyabilme potansiyeli bulunduruyor. Aslında bakacak olursanız çalışmanın ardındaki ekip, devasa depolama kapasitelerine olanak sağlayabilecek ve oldukça aşırı düzeyde dijital veri barındırabilecek DNA alfabesini yapay olarak genişleten ilk ekip olma özelliğini taşıyor.
Hiper küçük alanlarda akıl almaz miktarda veri içerecek kadar geniş ve yoğun olan DNA’da bulunan çift sarmal ipliklerin, yalnızca 10 mikrometre genişliğindeki hücre çekirdeğinin içine sıkışmış olmasına rağmen vücudumuzun tüm verisini saklaması ve doğada bol miktarda bulunan DNA’nın süper zorlu koşullara bile dayanıklı olması, bilginin korunması için aslında DNA’nın mükemmel bir bellek olduğu anlamına geliyor. Bu konuya dair konuşan çalışmanın ortak yazarlarından Beckman İleri Bilimler ve Teknoloji Enstitüsü’nden araştırmacı Kasra Tabatabaei, “İnternette her gün birkaç petabayt veri üretiliyor. Bu verileri depolamak için yalnızca bir gram DNA yeterli olacaktır. DNA bir depolama ortamı olarak bu kadar yoğundur.” şeklinde kaydediyor.
DNA, sadece dört ‘harf’ kullanarak bütün canlıların genetik bilgilerini kodluyor
Peki, biyolojik açıdan bakacak olursak, DNA’nın veri toplaması işlemi nasıl işliyor? Şöyle ki DNA, genetik bilgiyi nükeotid adı verilen, adenin (A), guanin (G), sitozin (S) ve timin (T) olmak üzere dört farklı molekül sayesinde kodluyor. Bir bakıma DNA’nın bu dört molekülü temsil eden harflerden oluşan 4 harflik bir alfabesi olduğu ve farklı harf kombinasyonlarının farklı veri bitlerini temsil ettiği söylenebilir. Bu da demek oluyor doğa, sadece bu dört harfi kullanarak dünya üzerindeki bütün canlıların genetik bilgisini kodluyor. Teknik olarak düşünürsek bu, DNA’daki harfler aracılığıyla bizim de bir ton dijital veri depolayabilmemiz gerektiği anlamına geliyor.
Peki, ya bu alfabe dört değil de daha fazla harften oluşsaydı? Bunun olması durumunda veri depolama kapasitesi çok, çok daha büyük olurdu ki, çalışma ekibinin yapmaya çalıştığı şeyin de aslında tam olarak bu olduğu söylenebilir.
Bu durumu yazı yazmak için kullandığımız alfabeden yola çıkarak açıklayan ve eğer elimizde sadece 4 harf olsaydı üretebileceğimiz kelimelerin sayısının oldukça kısıtlı olacağını belirten Tabatabei, “Alfabenin tamamı olursa, sınırsız kelime kombinasyonu üretebilirsiniz. DNA’da da aynı şey. Sıfırları ve birleri A, G, C ve T’ye dönüştürmek yerine, sıfırları ve birleri A, G, C, T’ye ve depolama alfabesindeki yedi yeni harfe dönüştürebiliriz.” ifadelerini kullanıyor.
Ekip, DNA tarafından kodlanan verinin algılanmasını ve geri aktarılmasını sağlayan bir mekanizma da geliştirdi
Buna ek olarak araştırmacılar, bu 11 harfle kodlanan bilgilerin talep üzerine geri aktarılmasını sağlayan, sentetik DNA’nın verilerini tam olarak geri okuyan yeni bir mekanizma da geliştirdiler. DNA’nın harf kombinasyonlarının son derece net bir şekilde okunmasını sağlayan mekanizmanın, insan yapımı DNA harfleri ile doğal olanları ayırt etmek ve her şeyi birbirinden ayırmak için derin öğrenme algoritmaları ve yapay zeka kullandığı bildiriliyor.
Çalışmanın ortak yazarlarından Illinois Urbana-Champaign Üniversitesi’nden yüksek lisans öğrencisi Chao Pan ise, mekanizmaya ilişkin olarak “11 nükleotidin 77 farklı kombinasyonunu denedik ve yöntemimiz her birini mükemmel bir şekilde ayırt edebildi” diyor ve “Farklı nükleotidleri belirleme yöntemimizin bir parçası olan derin öğrenme çerçevesi evrenseldir, bu da yaklaşımımızın diğer birçok uygulamaya genelleştirilebilirliğini sağlar.” diye de sözlerine ekliyor.