Google’ın yeni yapay zeka büyük dil modeli lansmanının en etkileyici yönlerinden biri olan “Gemini ile Elde Deneyim” videosunun sahnelendiği ortaya çıktı. Bloomberg’le konuşan bir Google sözcüsü, videonun gerçek zamanlı olarak kaydedilmediğini, ayrıca sesli komutların kullanılmadığını ve Gemini ile olan sesli etkileşimin daha sonra dublajlandığını itiraf etti. Google ayrıca, videonun nasıl yapıldığını gösteren bir blog yazısı da yayınladı.
Google CEO’su Sundar Pichai, “Gemini’nin altında yatan inanılmaz yeteneklerini anlamanın en iyi yolunun onları eylemde görmek olduğunu” söyleyerek bu videoyu paylaştı. Ancak, videonun YouTube açıklamasında “Bu demo için, gecikme azaltılmış ve Gemini çıktıları özlü olması için kısaltılmıştır.” şeklinde bir dipnot yer alıyordu. Ancak, Google sözcüsü Bloomberg’e, videonun, görüntülerden alınan sabit resim çerçeveleri kullanılarak ve metin yoluyla komut verilerek bir araya getirildiğini söyledi. Buna göre, Gemini yalnızca yazılan komutlara ve yüklenen sabit resimlere yanıt verdi. İnsanın konuşması, çizim yapması, nesneleri göstermesi, fincanlarla ve diğer nesnelerle oynaması gibi konuşma akışı, sadece demo videosu için sahnelenmiş gibi görünüyor.
Google DeepMind’ın Araştırma ve Derin Öğrenme Lideri VP’si Oriol Vinyals, “Gemini ile Elde Deneyim” videosu hakkında daha fazla açıklama yaptı. Vinyals, “Video, Gemini ile oluşturulan çok modlu kullanıcı deneyimlerinin nasıl görünebileceğini gösteriyor.” dedi ancak, video “gerçek, kısaltılmış özlü içerik” olduğu iddiasını tekrarlaması nedeniyle eleştiri aldı.