Teknoloji devi Meta, neredeyse 100 farklı dilde konuşma metinlerini çevirebilen “SeamlessM4T” adlı yeni bir modeli tanıttı. “SeamlessM4T”, “Büyük Ölçekli Çok Dillilik ve Çok Modlu Makine Çevirisi”nin kısaltması. Bu model, hem konuşma metinlerini yazılı metinlere dönüştürebiliyor hem de yazılı metinleri konuşma metinlerine çevirebiliyor. Ayrıca, konuşma-konuşma ve metin-konuşma işlemleri için 100 giriş dilini algılayabiliyor ve bunları 35 farklı çıkış diline dönüştürebiliyor.
Meta dil çevirisinde devrim yaratıyor
SeamlessM4T, araştırmacıların ve geliştiricilerin kullanımına sunulan bir lisans olan Creative Commons CC BY-NC 4.0 lisansı altında piyasaya sürüldü. Şirket, “Babel Balığı” adlı kurgusal karakterden ilham alarak, dünya dilleri arasındaki bariyerleri aşmayı hedeflediğini belirtiyor. Ayrıca, mevcut çeviri sistemlerinin dünya dillerinin sadece bir bölümünü kapsayabildiğine de dikkat çekiyor.
SeamlessM4T modelinin tek adımda çeviri yeteneği
SeamlessM4T modelini diğer büyük çeviri modellerinden ayıran en önemli özelliklerden biri, çeviri işlemini tek bir adımda tamamlaması. Diğer büyük modellerin aksine, bu model çeviri görevini farklı sistemlere ayırmadan bütün olarak gerçekleştiriyor.
Modelin diğer bir çarpıcı özelliklerinden biri ise, konuşmacının birden fazla dil arasında geçiş yapması veya aynı cümle içinde farklı dilleri kullanması durumunu algılayabilme yeteneği. Meta, modelin Hindice, Telugu ve İngilizce gibi farklı diller arasındaki geçişleri hızla tanıyabildiğini belirtiyor.
SeamlessM4T modelinin geliştirilmesi sırasında Meta, hassas kelimeleri algılamak için bir sistem de geliştirdi. Meta’nın amacı, çeviri sırasında nefret, şiddet veya istismar içerebilecek ifadeleri belirleyebilmek. Meta ayrıca, cinsiyet önyargısını tespit edebilen bir yeteneğe sahip olduklarını da belirtiyor. SeamlessM4T, cinsiyetle ilgili ifadeleri algılayarak, çevirilerde cinsiyet eşitsizliğini önlemeyi amaçlıyor.