Yapay zeka, hayatlarımızı kolaylaştırmaya devam ediyor. Bu alanda çığır açan yeni bir çalışma, ağır felçli bir kadının beyin sinyallerini konuşmaya ve yüz ifadelerine dönüştürüyor. Hasta artık dijital bir avatar aracılığıyla iletişim kurabiliyor. Bu başarı, felç ve ALS gibi rahatsızlıklar nedeniyle iletişim yeteneğini kaybeden kişilere umut veriyor.
Daha önce hastalar, kelimeleri oluşturmak için genellikle göz izlemeyi veya ince yüz hareketlerini içeren yavaş konuşma sentezleyicilerine güvenmek zorunda kalıyordu. Dolayısıyla bu durum, doğal konuşmaların yürütülmesini zorlaştırıyordu. Konuyla ilgili UC San Francisco (UCSF) tarafından YouTube’da yayınlanan bir videoyu aşağıda sizlerle paylaşmak istedik.
Videoda yeni teknolojinin beyin yüzeyindeki küçük elektrotları kullanarak konuşma ve yüz ifadelerini kontrol eden beyin bölgelerindeki elektriksel aktiviteyi tespit ettiği görülmekte. Bu sinyaller dijital bir avatar tarafından anında konuşmayı mümkün kılıyor. Karşılık gelen yüz duygularına dönüştürülerek gülümseme, kaş çatma veya şaşkınlık gibi ifadelere olanak sağlıyor.
Ann adındaki 47 yaşındaki hasta, 18 yılı aşkın bir süre boyunca şiddetli felç geçirdi. Ne yazık ki bu durum onu konuşamaz veya yazamaz hale getirdi. Tipik olarak hareket izleme teknolojisini kullanarak dakikada 14 kelimeye kadar yavaş iletişim kurabilmekteydi. Ann, avatar teknolojisinin yardımıyla danışman olarak çalışmayı arzuluyor.
Yapay zeka felçi birinin konuşmasını nasıl sağlıyor?
Araştırma ekibi, Ann’in beyin yüzeyine, özellikle konuşmayla ilgili bölgelere 253 kağıt inceliğinde elektrot yerleştirdi. Bu elektrotlar, dil, çene, gırtlak ve yüz kaslarını kontrol edecek beyin sinyallerini yakaladı.
Ann, farklı konuşma sesleri için beyin sinyallerini tanıyacak bir yapay zeka algoritması geliştirmek üzere ekiple anlaştı. Bilgisayar 39 farklı sesi başarıyla öğrendi. Böylelikle ChatGPT tarzı bir dil modeli bu sinyalleri tutarlı cümlelere dönüştürdü. Bu cümleler, Ann’in düğününün bir kaydına dayanan yaralanma öncesi sesine benzeyen bir avatarı kontrol etmek için kullanıldı.
Kusursuz olmasa da, yine de yüzde 28’lik kelime çözme hata oranı oldukça etkileyici bir başarı. Çalışmada dakikada 78 kelimeye denk gelen bir beyin-metin oranı kazandı. Bu sonuç, normal konuşmada genellikle kullanılan 110-150 kelime aralığıyla karşılaştırıldığında oldukça olumlu bir gelişme.
San Francisco’daki California Üniversitesi’ndeki (UCSF) girişime liderlik eden Profesör Edward Chang konuyla ilgili şunları söyledi: “Amacımız, başkalarıyla konuşmanın gerçekten en doğal yolu olan, tam ve somutlaşmış bir iletişim biçimini yeniden oluşturmak. Bu gelişmeler bizi hastalar için gerçek bir çözüm bulmaya daha da yaklaştırıyor.”