Google, Meta’nın Make-A-Video platformuna rakip olarak video klipler oluşturabilen yapay zeka ile video oluşturma platformu Imagen Video’yu duyurdu. Şirket, Imagen Video’nun yüksek derecede kontrol edilebilirliğe ve görüntü oluşturma yeteneği de dahil olmak üzere dünya bilgisine sahip bir sisteme doğru bir adım olduğunu iddia ediyor.
Imagen Video, mevcut sistemlerin anlamakta güçlük çekeceği altyazıları canlandırmak için bir yetenek göstererek, son teknolojilere göre önemli bir sıçrama gibi görünüyor. Imagen, mevcut birçok veri örneğini nasıl yok edeceğini ve kurtaracağını öğrenerek yeni veriler üreten, “yayılma” modeli olarak bilinen bir platform. Model, mevcut örnekleri besledikçe, yeni işler yaratmak için daha önce yok ettiği verileri kurtarma konusunda daha iyi hale geliyor.
Imagen Video’nun arkasındaki Google araştırma ekibinin açıkladığı gibi, sistem bir metin açıklaması alıyor ve 24×48 piksel çözünürlükte 16 kareden oluşan 3 video oluşturuyor. Ardından, sistem ek kareleri yükselterek tahmin ediyor ve 128 kareden oluşan ve 1280×768 piksel çözünürlüğünde videolar oluşturabiliyor.
Ekip ayrıca çalışmalarda, Imagen Video’nun Van Gogh resimleri ve sulu boya tarzında videolar oluşturabildiğini buldular. Bu nedenle, Imagen Video’nun derinlik ve üç boyutluluk anlayışını gösterdiğini, etrafında dönen ve nesneleri bozmadan farklı açılardan yakalayan drone geçişleri gibi videolar oluşturmasına izin verdiğini iddia ediyor.