Apple, kullanıcıların fotoğraf düzenleme sürecini daha da kolaylaştırmak için yenilikçi bir adım attı. Şirket, Santa Barbara Üniversitesi (UCSB) ile birlikte geliştirdiği MGIE (MLLM-Guided Image Editing) modelini duyurdu. Bu model, kullanıcıların fotoğrafları metin girişleriyle kırpma, boyutlandırma, döndürme ve filtre ekleme gibi işlemleri gerçekleştirmelerine olanak tanıyor.
MGIE, kullanıcılara metin girişleri aracılığıyla istedikleri düzenlemeleri yapabilme imkanı sunuyor. Kullanıcılar, fotoğrafta neyi değiştirmek istediklerini basit bir dille ifade ederek MGIE’yi kullanabiliyorlar. Örneğin, bir pepperoni pizzasının fotoğrafını daha sağlıklı hale getirmek isteyen bir kullanıcı, sadece “daha sağlıklı hale getir” gibi bir komutla sebzeli malzemelerin eklenmesini sağlayabiliyor.
Apple ve UCSB araştırmacıları, MGIE’nin kullanım alanlarını genişletmek için çeşitli çalışmalar yürütüyorlar. Model, kullanıcı girişlerini yorumlamayı öğrenirken aynı zamanda düzenlemenin nasıl olacağını hayal ederek görüntü düzenlemeyi gerçekleştiriyor. Örneğin, bir kullanıcının bir fotoğrafta gökyüzünü daha mavi yapmak istemesi durumunda, MGIE görüntünün gökyüzü kısmındaki parlaklığı arttırarak isteği yerine getiriyor.
Apple, MGIE’yi kullanıcılara sunmak için GitHub üzerinden indirme imkanı sağlıyor. aAyrıca Hugging Face Spaces üzerinde bir web demo yayınladı. Ancak şirket, modelin gelecekteki kullanım alanları hakkında henüz resmi bir açıklama yapmadı.
Bu gelişme, Apple’ın yapay zeka alanındaki adımlarını genişletme stratejisinin bir parçası olarak öne çıkıyor. Şirketin CEO’su Tim Cook, daha fazla yapay zeka özelliğini cihazlarına entegre etme hedefini belirtmişti. MGIE’nin yanı sıra, geçtiğimiz Aralık ayında Apple araştırmacıları, Apple Silicon yongalarında yapay zeka modellerini eğitmeyi kolaylaştırmak için MLX adlı açık kaynaklı bir makine öğrenimi çerçevesi yayınlamışlardı.
Bir Yorum