Makineler insan sesini çok daha doğal taklit edebilecek

Sentetik sesler ne kadar gelişmiş de olsa insan kulağını tırmalıyor. Aracımızda giderken navigasyonun sesi, akıllı ev cihazlarındaki yönlendirmeler ya da benzeri uyarılar içerisinde bir sunilik barındırıyor. İşte yeni geliştirilen bir teknoloji sayesinde sentetik sesler çok daha insansı bir şekilde tınlayacak. Bugüne kadar daha çok sese odaklanan uzmanlar artık sadece sese değil sesi nasıl çıkardığımızı da masaya yatırıyor. Çünkü sesi çıkarma şeklimiz sentetik seslere göre küçük farklara neden oluyor ve bu küçük farklar cümle gibi uzun bir söz diziminde rahatsız edici olabiliyor.

Ses hastalıklarına çözüm

Northeastern Üniversitesi’nde Rupal Patel başkanlığında yürütülen çalışma özellikle farklı duygular anında sesin fiziki olarak vücudumuzda nasıl bir değişim sonucu farklı tınladığı üzerine odaklanıyor: “Bazen ses konusu göz ardı ediliyor. İnsanın sesi vermek istediği mesaja göre şekilleniyor.”

Patel bu sistemi geliştirerek hastalık seviyesinde konuşma sorunu yaşayan kişilerin yaşam kalitesini artırabilmeyi umut ediyor. Hatta Patel, 2014 yılında bu tarz hastaları sentetik seslerle buluşturan ve bugün çeşitli firmalar tarafından kullanılan VocaliD isimli özel bir çalışmaya imza atmıştı.

Yapay zekaya doğal ses

Makine öğrenimi ile ortak çalışan VocaliD kısa zamanda büyük yol kat ederek insan seslerini ve konuşmasını hâlâ analiz ediyor. Özellikle sesler arasındaki sessizlik gibi çok değişken ve belli kurallara tabi olmayan durumları çözerek sentetik seslerin çok daha doğal bir hale gelmesi hedefleniyor. Adım adım bu hedefleri gerçekleştiren Patel, yapay zekayı doğal sese kavuşturan bilim insanı olabilir.

Etiketler