Uygulanabilir ve uygulanması zor olanlar arasında gidip gelen beş Büyük Veri projesini ele aldık. Bu projeler ve bunların benzer çalışmaları yaşamı büyük oranda değiştirebilir.
Gereğinden fazla abartılan teknoloji trendleri enerjilerini çok çabuk tüketiyor ki bu da bazılarımızı Büyük Veri hususunda şüpheci yapabiliyor. Diğer açıdan her ne kadar büyük veri dünyamızı değiştirecek en yeni trend olarak anılıyor olsa da onun hakkındaki mevcut kuşku, bulut ve sosyal taraf için var olan şüpheler kadar yoğun değil.
Bu da muhtemelen Büyük Veri’yi benimseyen organizasyonlar için hakiki kazanımlar üretiyor olmasından kaynaklanıyor. Büyük Veri analitikleri çoktan ilaç araştırmaları, satış ve pazarlama ile ürün geliştirme gibi birbirinden çok farklı disiplinleri temelden değiştirmeye başladı.
Akıllı şehirler ve sürücüsüz araçlar gibi bir çok kullanım imkanı etrafımızı çevrelemeye başladığı dünyada, ihtiyaçlarımız için Jetgiller gibi bir yaşam tarzının olabileceği düşüncesi bizleri fazlasıyla heyecanlandırıyor. Söz konusu senaryo Büyük Veri’nin geleceği olabilir ancak şimdilik onlar ‘günümüzün’ Büyük Veri’si değil olmak için hazır değil.
“Teknoloji olarak uygulanabilir olan ile pratik olan arasında önemli bir ayrım bulunuyor” diye konuşuyor bir veri analitiği firması olan Infobright CEO’su Don DeLoach. “Büyük Veri’yi yönlendiren şu iki trende bir bakalım: Nesnelerin İnternet’i ve makineden makineye iletişimler. Her ikisi de uzun bir süredir mevcutlar ancak git gide daha karmaşık bir hale gelen sensörlerle beraber düşen maliyetleriyle çeşitli kablosuz iletişim seçeneklerinin de yaygınlaşması; bir zamanlar teorik olarak teknolojik anlamda olası olanın artık uygulanabilir hale geldiği anlamına geliyor.
En tutkulu Büyük Veri hayallerimizin bazıları henüz uygulanabilir olma gerçekliğine ulaşabilmiş değil değiller. Sürücüsüz araçlar için gerekli olan teknoloji mevcut ancak altyapısı henüz hazır değil. Yine de bu hala çok fazla ilgi uyandırıyor. “ROI’nin en belirgin olduğu yere insanlar yatırım yapacak. Ve öyle de yapıyorlar.” diyor DeLoach.
Sağlık, taşıt telematikleri ve online pazarlama alanlarındaki ROI zaten belli. Bu da sonunda sürücüsüz araçları ve süper akıllı şehirleri görmeyeceğimiz manasına gelmiyor. Bu yalnızca büyük ölçekteki yatırımları cezp edecek kadar pratik olmadıkları manasına geliyor sadece.
Uygulanabilir ve uygulanması zor olanlar arasında gidip gelen beş Büyük Veri projesini ele aldık. Bu projeler ve bunların benzer çalışmaları yaşamı büyük oranda değiştirebilir.
İnsan Genom Projesi tıbbi tedavide devrim yaratıyor
İnsan Genom Projesi ilk kez 1990’da meydana çıktığında onu bir Büyük Veri projesi olarak düşünmedik ama öyleydi. Zaman içerisinde eksiksiz bir insan genomu 2003 yılında haritalandırıldı, Büyük Veri hareketinin öncülerinden bazıları teknoloji dünyasına süzülmeye çoktan başlamıştı.
Dolayısıyla çoktan başarılı bir kayıt elde edildiğinden sağlık ve ilaç sektörlerinin Büyük Veri araçlarını ilk benimseyen en agresif sektörlerden ikisi olması hiç te şaşırtıcı değil.
İnsan Genom Projesi aynı zamanda bir tür Büyük Veri Moore yasasını resmetti. Yüz dolar ya da daha düşük bir fiyata 23andMe gibi sitelerden genomunuzun tam olmasa da faydalı olan bir görüntüsünü alabilirsiniz ve yakın bir zamanda da kişisel genomunuzun eksiksiz bir haritasını aynı fiyata alabilmeniz için çalışmalar sürüyor. Fiyatlar her geçen yıl düşüyor. Genomunuzu eksiksiz olarak 1,000 ila 5,000 dolar arasında bir fiyatla çıkartabilirsiniz. 2007’de bunu gerçekleştirmek için minimum 1 milyon dolar harcamanız gerekiyordu.
Life Technologies (yakın zamanda Thermo Fisher Scientific tarafından satın alındı) ve InVitae gibi startup firmaları genom haritasını çıkartma işlemini herkesin karşılayabileceği bir seviyeye çekmek için yoğun bir biçimde çalışıyor ki bu da kanserden eklem iltihabına kadar kişiselleştirilmiş tedavilerin önünü açması bekleniyor.
Emory Üniversitesi Hastanesi ve IBM geleceğin ICU’sunu geliştiriyor
Emory University Hospital bir araştırma projesi için IBM ile Excel Medical Electronics (EME)’nin bir yazılımından yararlanıyor ve burada gerçek zamanlı analitik akışları üzerinden kritik hastalar için ileri düzey, tahmine dayalı tıbbi tedavi oluşturmak gibi bir amaçları var.
Emory şu anda hastalardaki tehlike sinyallerini anında hekimlere iletmek üzere fizyolojik verilerdeki kalıpları belirleyebilen yeni bir sistem üzerinde çalışıyor. Tipik bir ICU’da (Cihaz Kontrol Ünitesi) hastanın yatak başında bir düzine farklı medikal verisini görüntülüyor; kalp ritmi, solunum, beyin dalgaları ve kan basıncı gibi. Hayati işaretlerin bu kesintisiz beslemesi dalga ve rakamlar olarak iletiliyor ve her yatak başında rutin bir biçimde görüntüleniyor. Halihazırda tıbbi kararları verebilmek için tüm bu verileri hızla işleyip analiz etmek doktor ve hemşirelere bağlı. Bugün erken bir uyarı işareti olabilecek normalden en ufak bir sapma, genellikle fark edilmiyor.
Sistem, hastaların fizyolojik verilerini gerçek zamanlı olarak toplayıp analiz etmek üzere EME’s BedMasterEX, IBM InfoSphere Streams ve Emory’nin analitik motorunu kullanıyor. Yeni sistem doktorların birkaç yıl öncesinde hayal dahi edemeyecekleri bir hızda yüksek hacimli medikal verileri toplamalarına, analiz etmelerine ve bağıntı kurmalarına imkan sağlayacak.
“Gerçek zamanlı veriye erişim sağlamak ve buradan bir içgörü çıkarmak, bir hasta için hayati bir derecede önemli olabilir” diyor Emory Üniversitesi Hastanesi acil tedaviler direktörü Tim Buchman. “Bu yeni sistem üzerinden binlerce akışkan veri noktasını analiz edebilecek ve hangi hastanın bizim acil müdahalemize gereksinim duyduğuna ve hastayı nasıl tedavi edeceğimize dair daha iyi kararlar vermek için buradan elde edilecek içgörüleri kullanabileceğiz. Bu bizi acil tedavi vakaları için çok daha dikkatli yapıyor.”
Yazılım; kan zehirlenmesi, kalp krizi veya zatürree gibi ciddi komplikasyonları işaret edebilen kalıpları tanımlayarak hekimlere vakit kaybetmeden müdahale edebilecekleri gerçek zamanlı tıbbi anlayışlar sağlamayı amaçlıyor.
Penn State Salis Lab sentetik organizmalar oluşturmaya yardımcı oluyor
Penn State Üniversitesi kimya mühendisliği departmanı yardımcı doçentlerinden Howard M. Salis, kendi kendine kod yazmayı öğrendi ve yüksek performanslı bir bilgiişlem web portalını, Salis Lab’ı inşa etti. Söz konusu portal sentetik biyoloji ve metabolik mühendislik alanlarındaki araştırmacıların sentetik organizmaları tasarlamak üzere bilgiişlem metotlarını kullanmalarına zemin hazırlıyor.
“Mikroorganizmalar dünya üzerindeki en iyi kimyagerler” diyor Salis. “Onlardan yararlanmayı öğrenebilirsek, çok çeşitli ürünler imal edebiliriz. Geçmişte genetik mühendisliği daha çok tamir etmeye çalışmak ve deneme/yanılmaydı“ diye ekliyor Salis. Diğer bir ifadeyle genetik mühendisliği çok daha küçük bir özne havuzu içerisinde rastlantısal, ağır ve daha çok doğal bir seçimdi.
“Sentetik biyoloji, diğer yandan, daha çok bir mühendislik disiplinidir. Biz her şeyi ölçmek istiyoruz. DNA farklı yollardan mutasyona uğradığında neler olabileceği hakkında nicel tahminler yürütmek için kullanabileceğimiz biyo-fiziki modeller geliştiriyoruz” diye açıklıyor Salis.
Sentetik biyoloji aşırı derecede kompleks algoritmalar içerdiğinden proje ihtiyaç duyulduğunda ölçeği küçültülüp büyültülebilecek AWS Elastic Compute Cloud üzerinde barındırılıyor. Kısa bir DNA dizilimindeki olası mutasyon sayısı evrendeki atomların sayısında daha fazla. Salis Lab, son iki yılda web portalı üzerinden 30,000’i aşkın DNA dizilimini tasarlayan 2,000’dan fazla biyoteknoloji araştırmacısıyla çok popüler bir hal aldı.
Buradaki uygulamalar araştırmacıların hayal güçleriyle sınırlı. Amaçlardan bir tanesi fosil yakıtların kullanımına ekonomik olarak rakip olabilecek bir yakıt kaynağını sağlayacak mikro organizmaları üretmenin bir yolunu ortaya çıkartmak. Daha olağan kullanım vakalarından bir tanesi, kot giysiler için pigmentler geliştirmek.
Daha inanılmaz olanı ise araştırmacıların sahip olabileceği tahmin gücü. “Modellerimizi kullanarak gerçekte evrimi öngörebiliyoruz” diyor Salis. “Evrimin takip edeceği en olası yönü tahmin etmek üzere DNA mutasyonlarındaki etkiyi simüle edebiliyoruz.” diye de ekliyor Salis.
Nihai olarak bu, araştırmacıların evrime dayanıklı olan mikroorganizmalar geliştirmesine imkan tanıyabilir. Bunun olası kullanım durumları sınırsız. Dünya üzerinde milyarlarca mikroorganizma bulunuyor ve her biri bizim için çalışmalarını sağlayabileceğimiz kendi genom parçalarına sahip. Söz konusu genomları dizmek, onları ölçüp kataloglamak ve nihayetinde bunları faydalı yollardan nasıl bir araya getirebileceğimizi öngörmek devasa bir Büyük Veri sorunu. Fakat bu Salis gibi araştırmacıların uğraşmaya hevesli olduğu bir güçlük çıkaran bir durum.
Georgetown Global Anlayış İnsiyatifi “Büyük Problemler”in üstesinden geliyor
Georgetown Üniversitesi Global Anlayış İnisiyatifi, toplum yapısı trendlerinden anlayış elde etmek üzere tüm dünya üzerinden verileri topluyor. Global Anlayış İnisiyatifi verileri analiz ediyor ancak öncelikle onları topluyor, organize ediyor ve ardından çok karmaşık soruların yanıtı vermek için paketliyor.
“Dünya hakikaten karmaşık bir sistem; etkileşim kuran ve kaynaklar için rekabet eden 7 milyar insan var” şeklinde konuşuyor Georgetown Üniversitesi Global Anlayış İnisiyatifi direktörü J.C. Smart. Dünya üzerinde 40,000 şehir, 20 milyon kilometre yol, 800 milyon otomobil vs. mevcut. “Tüm bunların nasıl etkileşim kurduğunu ve tümünün bir diğerine nasıl bağlı olduğunu anlamak oldukça karmaşık bir sistem. Bu sistemlerin oluşturduğu bir sistem. İşte bu Büyük Veri ama daha önemlisi gezegene baktığınızda bunun adı Büyük Bilgi’dir.” açıklamasını yapıyor Smart.
Global Anlayış İnisiyatifi, bilgi tabanlarını geliştirebilmek için veri hacmini yönetebilmek üzere veri entegrasyon araçlarına gereksinim duydu. “Bilgi tabanı, hakkında konuştuğumuz şeyler için bir tahmin yürütebilmeniz için, trilyonlarca nesne ve katrilyonlarca ilişki hakkında konuşuyoruz” diye açıklıyor Smart.
Kapow Software, İnisiyatif’in bilgi tabanını genişletebilmek için yüksek hacimli veri entegrasyonunu otomatikleştirmek üzere Georgetown Üniversitesi Global Anlayış İnisiyatifi ile çalıştı. Buna gezegene bakmak ve ilgili “Büyük Bilgi”yi türetmek için 42 farklı dili konuşan 162 ülkeden 20,000’i aşkın web kaynaklarına erişmek de dahil şekilde yaptı. Otomasyon öncesinde söz konusu süreç çok fazla manuel yoğunlukluydu ki dokümanlarla diğer web çalışmalarını bulmak, almak ve organize etmek için düzinelerce insan gerekebiliyordu. Bunun ardından söz konusu bilgi koleksiyonunu analiz etmek için zaman ya da kaynağı nerede bulacaksınız?
Global Anlayış İnisiyatifi otomatik veri entegrasyon akışlarını (bilgi toplama robotları gibi düşünebilirsiniz) oluşturmak için Kapow’un yazılımını kullandı. Bir kez konuşlandırıldıktan sonra bu bilgi robotları tek bir kullanıcının (herhangi bir kod yazma becerisine ihtiyacı olmayan) aşırı derecede farklı verilerin bütünleşik bir görünümünü herhangi bir zamanda araştırabilmesi için binlerce otomatik veri entegrasyon aracını çalıştırıp idare etmesine imkan tanıyor.
Şimdi ise Global Anlayış İnisiyatifi hakikaten de güç “Büyük Problemlere” yanıtlar bulmaya çalışacak. Söz gelimi: “Su kaynaklarını en iyi nasıl dağıtırız? Hastalıkların yayılmasını nasıl asgari seviyeye çekeriz? Elektrik dağıtımını nasıl yönetiriz? Olabildiğince çok insana erişim sağlayan kliniklerin konumlarını nasıl yönetir ve felaket kapıyı çaldığında ya da afet vurduğunda tıbbi kaynakları nasıl konumlandırırız? gibi.
LA ExpressPark trafiği ve hava kirliliğini azaltma peşinde
Los Angeles’ın şehir merkezi son on yılda çok önemli bir büyüme kaydetti ve sorunlarıyla tanınmış bir bölgesi eğlence ve iş dünyası merkezine dönüştü. Diğer yandan büyümeyle birlikte muazzam bir trafik kamaşası ortaya çıktı. Sürücüler boş yollar ararken onlar sıklıkla aynı bloğun etrafında yarım saat ya da daha fazla dolanıyor.
“Los Angeles şehir merkezinde otopark çok pahalı bir şans oyununa dönüştü” diye konuşuyor Xerox kıdemli başkan yardımcısı ve genel müdürü David Cummins. Daha da kötüsü cadde üstü park ücretleri nadiren taleple eşleşiyordu. Fiyatlar birkaç blok ötedeki garajlara nazaran belirli bir alanda tek düzeydi ya da daha ucuzdu. UCLA profesörlerinden Donald Shoup’un araştırmasına göre şehir merkezindeki tıkanıklığının yüzde 74’ü caddelerde park yeri arayan sürücülerden kaynaklanıyordu. İnsanların çok fazla araç kullandığı bir şehirde sürücüleri daha uzağa park etmeye yönlendirecek herhangi bir teşvikte bulunmuyordu.
Arz ve talebi daha uyumlu hale getirmek ve trafik tıkanıklığını azaltmak üzere şehir yönetimi LA ExpressPark park sistemini geliştirmesi için Xerox’u getirdi. Xerox boş alanları tespit etmek için buz hokeyi topu büyüklüğündeki sensörleri park alanlarına yerleştirdi. Ardından arz ve talebi daha uyumlu hale getirmek amacıyla Xerox algoritma tabanlı bir dinamik fiyatlandırma motoru geliştirdi. Amaç yüksek yoğunluklu bölgelerdeki ücretleri arttırmak (yoğunluğu azaltmak için) ve nispeten daha boş olan bloklardaki ücretleri düşürmekti (insanları biraz daha ileriye gitmeleri için teşvik etmek için).
L.A.’in yabancısıysanız, şehrin yerlilerinin basitçe iki blok öteye park etmek ve beş dakika yürümek yerine durmaksızın blok etrafında dönüp durması sizi şaşırtabilir. Burada eksik olan şey ise farkındalık. İnsanlar iki blok öteye park etmenin daha uygun (ve ucuz) olduğunu bilmiş olsalardı o avantajdan yararlanmak isteyebilirlerdi.
Arz ve talep uyumlu bir hale getirildikten sonra gerçekleşen şey parkmetrelerin yüzde 60’ında fiyatların azalması, sadece yüzde 20’sinde artması oldu (diğerleri aynı kaldı.)
Sürücüleri boş park alanlarına yönlendirmek için yeni değişken mesaj işaretleri konuşlandırıldı. Bunlar durum değiştikçe otomatik olarak güncellenebilen işaretlerdi. Enformasyon aynı zamanda Parker ve Park Me gibi akıllı telefon uygulamalarının yanı sıra L.A. şehri web sitesiyle de paylaşıldı. Çok yakında Xerox söz konusu bilgiyi doğrudan navigasyon sistemlerine göndermeyi planlıyor ki bunlar sürücüleri otomatik olarak varış noktalarına en yakın boş park alanına yönlendirebilir ve belki de park ücretini otomatik olarak dahi ödeyebilir.
İlk sonuçlar umut verici. Şehrin daha az yoğun bölgelerinin toplam kullanımının artması çoktan fayda sağlamış durumda ve ücretler toplamda azalmasına rağmen gelirler yüzde 2 artmış duruda.
Daha da iyisi trafik sıkışıklığı azalmaya başladı ve sürücülerin L.A. ExpressPark sistemini öğrenmesiyle birlikte daha da iyileşebilir. “Otopark yöneticileri şehirlerindeki caddelerde neler olduğuna dair eksiksiz ve anlık görüntüye sahip ve ücret yapılarından parkmetre konumlarına kadar her şey üzerinde veri güdümlü kararlar verebiliyor. Birleşik teknoloji birden fazla tedarikçiyi bir araya getirdiğinden (ihlal cezalarının işlenmesinden bakım ve ücret toplama çalışanlarına) her şey otopark yönetimi için ulaşılabilir durumda. Veriyi bu şekilde kullanmak performansı arttırıyor ve ekstra getiriler yaratıyor” diye açıklıyor Cummins.
Cummins ayrıca bu programın sağladığı ilk sonuçların, veri güdümlü kararların sıkışık trafik ile hava kirliliğini azaltmak üzere kötü sürücü davranışlarının değişmesine yardımcı olabileceğini kanıtladığını ifade ediyor.