OpenAI, Sora,

OpenAI, metinleri videoya dönüştürebilen yeni dağıtım modeli Sora’yı duyurdu. ChatGPT’nin yaratıcısı olan OpenAI’nin yeni yapay zeka modeli, farklı çözünürlüklerde ve en boy oranlarında video oluşturabiliyor. Ayrıca mevcut videoları düzenleyerek sahne, ışık ve çekim tarzını metin komutuyla hızlıca değiştirebiliyor. Sora, ayrıca bir sabit resme dayanarak video oluşturabiliyor veya eksik kareleri doldurarak mevcut videoları uzatabiliyor. OpenAI, Sora’nın şu anda Full HD video içeriğinin bir dakikasına kadar oluşturabildiğini ve gördüğümüz örneklerin umut verici olduğunu paylaşıyor. Sora’nın oluşturduğu daha fazla video örneği için Sora’nın web sayfasını ziyaret edebilirsiniz.

Sora, birden fazla karakter, belirli türlerde hareket ve konu ve arka planın doğru ayrıntıları gibi karmaşık sahneler oluşturabiliyor. Model, sadece kullanıcının komutta istediği şeyleri değil, aynı zamanda bu şeylerin fiziksel dünyada nasıl var olduklarını da anlıyor. ChatGPT’ye benzer bir dönüştürücü mimarisi kullanarak çalışıyor. Ayrıca videoları ve resimleri yama adı verilen daha küçük veri birimleri olarak sunabilmekte. Sora tarafından oluşturulan videolar, statik gürültü olarak başlıyor. Model son ürünü oluşturmak için gürültüyü kademeli olarak azaltıyor. Gürültülü girdi yamaları yüksek kaliteli videoya dönüştürülüyor.

Sora ile oluşturulan, gerçek olmayan video görüntüleri

OpenAI, DALL·E 3’te kullandığı mevcut güvenlik protokollerini Sora için de uyguladığını paylaşıyor. Sora şu anda “kırmızı takım” üyeleri tarafından test ediliyor. Uzmanlar modeli potansiyel riskler için test edecek ve değerlendirecek. OpenAI ayrıca, Sora’nın potansiyel endişelerini ve kullanım durumlarını görmek için politika yapıcılar, sanatçılar ve eğitimcilerle de görüşmeler yapacak. Şimdilik resmi bir lansman tarihi verilmedi.