Google Genie 3 duyuruldu: İşte yenilikler

Google DeepMind, geçen yılın sonunda duyurulan Genie 2 modelinin geliştirilmiş bir versiyonu olan Genie 3’ü tanıttı. Yeni model, sırf bir görsel ya da metinle, saniyede 24 kare suratında ve 720p çözünürlükte gerçek vakitli, etkileşimli simülasyonlar oluşturabiliyor.
Genie 3 modeli görücüye çıktı
Kullanıcılar, oluşturulan bu dijital dünyaları klavye komutlarıyla denetim edebiliyor. Geliştirme süreci hala devam eden model, şu an sırf hudutlu sayıdaki araştırmacı ve uzman kümesine açık.
Genie 3, cümbüş ve oyun üretiminin ötesinde bir araç olarak konumlandırılıyor. DeepMind, modeli yapay genel zeka (AGI) araştırmalarında değerli bir evre olarak görüyor. Gerçek dünyadaki bilgiler artık yapay zekayı eğitmek için yetersiz kalırken, Genie 3 üzere modeller sayesinde sonsuz sayıda, denetimli ve tekrarlanabilir sentetik data üretilebiliyor. Bu da araştırmacılara yapay zekayı daha karmaşık, gerçek dünya gibisi senaryolarda eğitme imkânı sunuyor.
Yeni modelin en dikkat cazibeli farklarından biri, hafıza süresindeki artış. Genie 2 sadece birkaç saniyelik görsel hafızaya sahipken, Genie 3 bu süreyi dakikalar düzeyine çıkarıyor. DeepMind bu özelliği “uzun ufuklu hafıza” olarak tanımlıyor.
Model, oluşturduğu sahnelerdeki objelerin vakit içindeki hareketlerini hatırlayarak fizikî tutarlılığı koruyabiliyor. Örneğin, bir objenin hareket istikametini yanlışsız formda iddia edebiliyor ya da bir cismin devrilmeye hazır olduğunu fark edebiliyor. Bu çıkarımlar, modele dışarıdan kodlama yapılmadan, kendi tahsiliyle gerçekleşiyor.
Kullanıcılar, oluşturulan dijital ortama anlık olarak yeni karakterler, nesneler ya da hava olayları ekleyebiliyor. DeepMind bu özelliği “komutla tetiklenebilen olaylar” formunda tanımlıyor. Ortamın dinamik olarak şekillendirilebilmesi, Genie 3’ü etkileşimli senaryolar ve yapay zeka eğitimi için güçlü bir araç haline getiriyor.
Ancak Genie 3 hala kıymetli sınırlamalar içeriyor. Gerçek dünya yerlerinin ayrıntılı ve dengeli simülasyonunu gerçekleştiremiyor. Oluşturulan sahnelerde vakit zaman tutarsızlıklar görülebiliyor. İnsan figürleri bazen gerçekçi olmayan halde hareket ediyor, yazılı içerikler bozulmuş halde görüntülenebiliyor.
Bunun yanı sıra, simülasyon içindeki AI casusları sadece ortamda gezinebiliyor; misyon alacak ya da ortamı değiştirecek seviyede muhakeme yeteneğine sahip değiller. Simülasyondaki değişiklikleri gerçekleştiren casuslar değil, direkt Genie 3’ün kendisi oluyor.
Bir öbür kısıt ise simülasyon müddeti. Model, sırf birkaç dakikalık kesintisiz etkileşime imkan tanıyor. Halbuki karmaşık yapay zeka eğitimleri için çok daha uzun müddetli ve kesintisiz ortamlar gerekiyor. DeepMind, çoklu yapay zeka casuslarının birbiriyle etkileşime girebildiği senaryolar üzerine de çalışıyor fakat bu taraftaki geliştirmeler şimdi tamamlanmadı.
Genie 3’ün ticari kullanıma sunulmasına dair bir tarih açıklanmadı. DeepMind, modelin yüksek süreç gücü gerektirmesi nedeniyle maliyet ve ölçeklenebilirlik mevzularında vakit alacak bir süreç öngörüyor. Buna karşın, hudutlu erişimle test edilen modelin, yapay zekanın eğitilme usullerini ve kullanım alanlarını derinden değiştirebilecek potansiyele sahip olduğu belirtiliyor.