Yapay zeka matematik alanında zirveye çıktı

Google DeepMind ve OpenAI tarafından geliştirilen yapay zeka sistemleri, bu yıl Memleketler arası Matematik Olimpiyatları’nda (IMO) insanüstü bir muvaffakiyete imza attı. Her iki kurumun da farklı yapay zeka modelleri, müsabakada yer alan altı sorudan beşini yanlışsız yanıtlayarak 42 üzerinden 35 puan elde etti ve böylelikle altın madalya düzeyini yakaladı.
Yapay zeka, matematikte altın madalya alabilir
IMO, 1959 yılından bu yana düzenlenen ve cebir, geometri, kombinatorik üzere farklı alanlarda öğrencileri dört buçuk saat süren son derece zorlayıcı matematiksel sorunlarla karşı karşıya getiren, dünyanın en itibarlı akademik yarışları ortasında yer alıyor. Müsabakanın bu yılki ayağında birinci kere yapay zeka sistemlerinin bu derece yüksek muvaffakiyet göstermesi, bu teknolojilerin insan düzeyini geçme eşiğine geldiğine işaret ediyor.

Google DeepMind, geçtiğimiz yıl birebir yarışta geliştirdiği Gemini modeliyle müsabakaya katılmış, fakat gümüş madalya düzeyinde kalmıştı. Bu yıl ise Gemini modelinin özel bir sürümü olan Gemini Deep Think kullanıldı. Yeni sistem, klasik tek çizgi üzerinden ilerleyen akıl yürütme yerine, paralel düşünme sistemine dayalı yeni bir mimariyle çalışıyor.
Model, her sorun için birden fazla tahlil çizgisi kurarak bu yolları eş vakitli olarak test ediyor ve en dengeli sonuca ulaşana kadar hipotezleri çapraz denetim ediyor. Spekülatif akıl yürütme modülleri sayesinde model, sadece tahlile ulaşmakla kalmıyor; birebir vakitte matematiksel ispatların doğruluğunu artırmak için alternatif ispat yolları da geliştiriyor.
Bu model ayrıyeten doğal lisanda verilen sorun tariflerini direkt sembolik mantık yapılarına çevirebiliyor. Evvelki kuşak sistemlerde olduğu üzere sorunu bir programlama lisanına dönüştürme adımına gerek kalmadan, metinsel açıklama üzerinden adım adım geçerli bir ispat üretebiliyor.
DeepMind grubu, bu yapının uçtan uca bir tahlil sunduğunu ve rastgele bir dış müdahale gerektirmediğini vurguluyor. Müsabaka heyeti ise Gemini’ın sunduğu tahlil ve ispatların “insan tarafından yazılmış üzere göründüğü” yorumunu yaptı.
OpenAI cephesinde ise yarışa şimdi kamuya açıklanmamış deneysel bir model ile iştirak sağlandı. Bu model de çok adımlı akıl yürütme sürecine misal bir yaklaşım uyguluyor. Her sorunun tahlilinde semantik tahlil yolları haritalanıyor ve akabinde bu yollar mantıksal tutarlılıkla taranarak en sağlam sonuç üretiliyor.

Modelin öne çıkan taraflarından biri, sadece gerçek tahlile ulaşması değil, birebir vakitte oluşturduğu tahlil yollarını doğal lisanda ispatlama yeteneğine sahip olması. Gelişmiş kontrol modülleri sayesinde model, her tahlil adımını içsel olarak doğrulayabiliyor.
Her iki sistem de mevcut haliyle direkt son kullanıcıya sunulmayacak. OpenAI CEO’su Sam Altman, bu düzeydeki muhakeme kabiliyetinin şimdilik sadece araştırma maksatlı kullanılacağını belirtiyor. GPT serisi üzere halka açık sistemlerin bu seviyede matematiksel performansa ulaşmasının yakın vadede mümkün olmadığını tabir ediyor.