Apple, MGIE Adlı Yeni Yapay Zeka Modelini Duyurdu
Apple, imgeleri işlerken metin tabanlı komutları yorumlamak için çok modlu büyük lisan modellerini (MLLM’ler) kullanan MLLM Kılavuzlu Manzara Düzenleme ya da kısaca MGIE ismi verilen yeni bir yapay zeka modeli tanıttı. Öbür bir deyişle, araç, kullanıcının yazdığı metne nazaran fotoğrafları düzenleme yeteneğine sahip. Bunu yapabilen birinci araç olmasa da projenin “insan talimatları bazen mevcut usullerin yakalanıp takip edilmesi için çok kısadır” deniyor.
Şirket, MGIE’yi Santa Barbara’daki Kaliforniya Üniversitesi’nden araştırmacılarla geliştirdi. MLLM’ler, kolay yahut belgisiz metin istemlerini, fotoğraf düzenleyicinin izleyebileceği daha detaylı ve net talimatlara dönüştürme gücüne sahip. Örneğin, bir kullanıcı biberli pizzanın fotoğrafını “daha sağlıklı hale getirmek” için düzenlemek isterse, MLLM’ler bunu “sebze materyalleri ekleyin” olarak yorumlayabiliyor ve fotoğrafı bu biçimde düzenleyebiliyor.
MGIE, manzaralarda büyük değişiklikler yapmanın yanı sıra metin istemleri yoluyla fotoğrafları kırpabiliyor, tekrar boyutlandırabiliyor ve döndürebiliyor. Hatta parlaklığını, kontrastını ve renk istikrarını iyileştirebilmesi de mümkün. Ayrıyeten MGIE, bir fotoğrafın belli alanlarını düzenleyebiliyor ve örneğin fotoğraftaki bir kişinin saçını, gözlerini ve kıyafetlerini değiştirebiliyor yahut art plandaki öğeleri kaldırabiliyor.
Apple, modeli GitHub aracılığıyla yayınladı lakin ilgilenenler şu anda Hugging Face Spaces‘ta barındırılan bir demoyu da denebiliyor. Apple, bu projeden öğrendiklerini rastgele bir eserine dahil edebileceği bir araç yahut özellik olarak kullanmayı planlayıp planlamadığını ise detaylandırmadı.
Halkalı Merkez PlayStation Cafe sitesinden daha fazla şey keşfedin
Subscribe to get the latest posts sent to your email.