Google, I/O öncesinde Gemini’nin konuşma becerilerini gösteriyor!

Gemini’nin bu büyük özellik güncellemesi, OpenAI’nin daha gelişmiş ve bilim kurguvari özelliklerle dikkat çekmeye devam ettiği bir dönemde geldi.

Google Gemini, bilindiği üzere Google’ın ChatGPT’ye rakip olarak geliştirdiği bir yapay zeka model. Google I/O geliştirici konferansında yapılan duyuruya göre, Gemini 1.5 adlı yeni bir sürümü piyasaya sürüldü. Bu güncelleme, daha doğal bir konuşma deneyimi sunma yeteneği, artan uygulama uyumluluğu ve genel zeka seviyesinde büyük bir ilerleme sağlıyor.

Gemini 1.5, uzun bağlam anlama konusunda çığır açan bir özelliğe sahip. Model, 1 milyon tokene kadar olan bağlam penceresini sürekli olarak işleyebiliyor. Bu, büyük ölçekli temel modeller arasında en uzun bağlam penceresini temsil ediyor. Daha uzun bağlam pencereleri, tamamen yeni yeteneklerin kapısını aralıyor ve geliştiricilerin çok daha kullanışlı modeller ve uygulamalar oluşturmasına yardımcı oluyor. Şu anda sınırlı bir önizleme olarak sunulan bu deneysel özellik, geliştiricilere ve kurumsal müşterilere sunuluyor.

Gemini 1.5 Pro, standart olarak 128.000 tokenlık bir bağlam penceresine sahip. Ancak bugünden itibaren sınırlı bir grup geliştirici ve kurumsal müşteri, AI Studio ve Vertex AI üzerinden 1 milyon tokena kadar olan bir bağlam penceresiyle deney yapabilir. Google, bu bağlam penceresini daha da genişleterek kullanıcı deneyimini iyileştirmeyi ve gecikmeyi azaltmayı hedefliyor.

Gemini’nin bu büyük özellik güncellemesi, OpenAI’nin daha gelişmiş ve bilim kurguvari özelliklerle dikkat çekmeye devam ettiği bir dönemde geldi. Daha önce OpenAI, GPT-4o adlı yeni bir AI motorunu tanıtmıştı. GPT-4o da benzer şekilde doğal bir deneyim için cümle içinde kesilebiliyor. Ancak Gemini 1.5 Pro, hem ücretsiz hem de ücretli abonelere sunuluyor ve daha büyük bir kapasiteye sahip.

Google, Gemini AI’nın lansmanından bu yana bazı sorunlarla karşılaştı. İlk başta Bard adıyla tanıtılan Gemini, sunumunda önemli bir bilgiyi yanlış vererek hisse senedi fiyatının düşmesine neden oldu. Ayrıca, Gemini’nin tarihî figürleri kadın veya renkli insanlar olarak tasvir etmeye başlaması üzerine Google, görüntü oluşturma özelliğini devre dışı bırakmak zorunda kaldı. Ancak Google, bu güncellemeyle Gemini’nin konuşma yeteneklerini yeniden vurgulama fırsatını yakalıyor.

Gemini 1.5, gelecekteki konuşma teknolojisinin önemli bir adımı olarak karşımıza çıkıyor. Google’ın bu gelişmeleri takip ederek AI ürünlerini piyasaya sunması, değerlendirmelerde büyük bir rol oynayacaktır.

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu