Bilim adamları veri merkezini bir küp şeker boyutuna küçültmek için DNA’yı kullanmayı planlıyor.
DNA depolama binlerce yıl potansiyelini yitirmeyecek bir yeniliğin temellerini oluşturuyor. Microsoft ve Washington Üniversitesi araştırmacıları yaptıkları çalışmalarla sentetik DNA’nın veri arşivlemede kullanılabileceğini ortaya koyuyor. Araştırmacılar, teknolojinin kullanıma sunulacak kadar olgunlaşması halinde mega mağaza boyutunda ve en yüksek depolama kapasitesine sahip bir veri merkezinin küp şeker boyutuna indirilebileceğini belirtiyor. Araştırmacılar yazdıkları makalede DNA tabanlı depolamanın ciddi şekilde değerlendirilmesi ve sistem tasarımlarının ve mimari geliştirmelerin keşfedilmesi gerektiğini ifade ediyor.
Yapılan çalışmada dört resim dosyasındaki dijital verinin başarılı bir şekilde DNA’nın nükleotid birimlerine kodlandığını söyleyen araştırmacılar, daha önemlisi büyük bir DNA havuzundan eşleştirme gerçekleştirerek tek bir bayt bilginin kaybolmadan prosesin geri dönüşümünün sağlamayı başardı. Verilerin kodlanması ve tekrardan elde edilmesi konusunda yapılan bir çalışma Washington Üniversitesi tarafından “Voice from Rwanda Tribunal” projesi kapsamında aralarında hakim, avukat ve diğer görevlilerle gerçekleştirilen 49 video röportajına ait dosyalar ile yapıldı.
Washington Üniversitesi Bilgisayar Bilimleri ve Mühendisliği doçentlerinden ve makalenin yazarlarından olan Luis Ceze, insanlığın yaşam sistemlerinin nasıl çalışabileceği ve genlerle ilgili her türlü bilgiyi depolama konusunda oldukça kompakt ve sağlam yapıda olan DNA gibi mükemmel bir moleküle sahip olduğuna dikkat çekiyor.
Binlerce yıl saklama imkanı
Ceze, yaptıkları çalışmada temel olarak resim, video ve doküman gibi verilerin depolanması konusunda yüzlerce ve hatta binlerce yıl saklama imkanı sağlayacak bir yapı oluşturmayı hedeflediklerini dile getiriyor. DNA veri depolama konusundaki çalışmalar oldukça hızlı ilerliyor. 1999 yılında DNA tabanlı depolama ilk olarak 23 karakter uzunluğundaki bir mesajın depolanmasıyla gerçekleştirildi. 2013 yılında İngiltere merkezli EMBL-European Bioinformatics Institute yaptıkları çalışmalarda Martin Luther King’in “I Have a Dream” konuşmasının bulunduğu bir .mp3 dosyasının kodlandığını belirtti. İngiltereli araştırmacılara göre DNA yapılarında saklanan verilerin onlarca ve hatta binlerce yıl depolanabilmesi mümkün.
DNA’nın okunması kolay bir süreç olmasına karşın verilerin DNA birimlerine yazılmasında aşılması gereken iki önemli nokta bulunuyor. Bunlardan birincisi mevcut yöntemleri kullanarak verilerin yazılmasını gerçekleştirmek belirli zorluklar içermesiyken, ikincisi DNA’ların hem yazma hem de okuma esnasında özellikle aynı DNA harfinin tekrar etmesi durumunda problem çıkarmaya elverişli olması olduğunu söylemek mümkün. Microsoft ve Washington Üniversitesi araştırmacıları “yeni bir yaklaşım” geliştirerek DNA’larda yer alan uzun sıfır ve bir dizilerini DNA’nın adenin, guanin, sitozin ve timin olacak şekilde dört temel dizisine dönüştürdüklerini belirtiyor.
Depolanan verilere erişimde araştırmacıların DNA birimlerinde posta kodu veya sokak adresi gibi şifrelemeler gerçekleştirmesi bu alandaki önemli yeniliklerden birisi olarak dikkat çekiyor. Moleküler biyoloji alanında kullanılan Polimeraz Zincir Reaksiyonu (PCR – Polymerase Chain Reaction) bu çalışmalarda referans olarak alınan noktaların başında geliyor. DNA eşleştirme tekniklerinin kullanılması araştırmacılara verinin “okunması” ve video, resim ya da doküman dosyasına sokak adresi ve posta koduna benzer olan yapıyı kullanarak birleştirme imkanı sunuyor.
Washington Üniversitesi Elektrik Mühendisliği ve Bilgisayar Bilimleri ve Mühendisliği doçentlerinden Georg Seelig bu süreçte sıfır ve birlerden akıllı bir yaklaşımla yoğun ve hatasız bir şekilde adenin, guanin, sitozin ve timin yapılarına geçişin önemli olduğunu ifade ediyor. Microsoft ve Washington Üniversitesi araştırmacıları elde edilen sonuçları “ACM International Conference on Architectural Support for Programming Language and Operating Systems” etkinliğinde duyurdu.
Araştırmacılar DNA’nın oldukça sekiz köşeden oluşan yapısıyla teorik limitinin oldukça yoğun olduğuna dikkat çekere etkileyici bir imkan olduğunu dile getiriyor. Manyetik kaset teknolojisinin avuç içerisinde taşınabilecek tek bir kartuşa 185 TB veri depolama imkanı sunabilecek olması DNA’nın sınırlarının oldukça yüksek olduğuna işaret ediyor.
Microsoft ve Washington Üniversitesi araştırmacılarının sentetik DNA’ların 500 yıldan fazla depolama imkanı sunabilecek olduğunu belirtmesi önemli detaylardan bir diğeri olarak dikkat çekiyor. Kayıt kartuşlarının 10 ile 30 yıl arasında, sabit disklerin üç ile beş yıl arasında ömrünün olması araştırmacılar tarafından vurgulanan noktalardan bir diğeri olarak ön plana çıkıyor.
Bilgisayarlarımızda yer alan, geçmişe yönelik bilgiler içeren, fotoğraf, video ve kurumsal sistemlerde kullanılacak daha yoğun depolama ortamının oluşturulması ABD’li araştırmacılar tarafından üzerinde çalışılan konular arasında yer alıyor. Nitekim IDC ve EMC tarafından sağlanan veriler doğrultusunda Digital Universe tarafından oluşturulan raporda tüm bu ortamlardaki verilerin 2020 yılında 44 trilyon gigabayta ulaşacağı tahmin ediliyor.
2013 yılına kıyasla 10 kat artış yaşanacak olması yayınlanan makalede dikkat çekilen detaylardan bir diğeri olarak ön plana çıkıyor. Kullanılan verilerin tamamının depolanma zorunluluğu olmamasına karşın dünya genelinde depolanacak kapasiteden daha hızlı veri oluşturulabiliyor olması kritik detaylar arasında yer alıyor. DNA depolama sisteminin ticari olarak kullanıma sunulmadan önce hala aşılması gereken bazı problemlerinin bulunduğunu göz ardı etmemek gerekiyor. DNA sentezinin ve diziliminin her nükleotit için yüzde 1 civarında hata oranlarıyla gerçekleşmesi aşılması gereken ilk problem iken; kodlama şemalarının hatalarda tolerans sağlayacak nitelikler taşımasının en önemli ikinci nokta olduğunu söylemek mümkün.
Ayrıca DNA tabanlı depolamada verilere rastgele olarak erişim sağlanması yazma işleminden çok daha uzun sürecek ve okuma konusunda gecikmelere sebep olabilecek işlemlerin ortaya çıkmasına neden olmaktadır. Şu anda yapılan çalışmalar sadece büyük bloklara erişim için gerçekleştiriliyor. Ancak büyük verilerin dışında tek bir bayt verinin dahi depolama biriminden okunabilmesi için tüm DNA havuzunun sıralanması ve şifrelerinin çözülmesi gerekiyor. Bilim adamları polimeraz zincir reaksiyonunu kullanarak rastgele verişim konusunda sadece istenilen verilere erişimde sıralamaları çaprazlayarak süreci hızlandırma üzerinde çalışmalar yapıyor. Bu sayede hem okuma hızının arttırılması hem de tüm DNA havuzunda yeniden dizilim gerçekleştirilmeden veriye erişimin sağlanabilmesi mümkün hale getirilebilir.