26 dakikada 50 dolara OpenAI’a rakip yapay zeka yaptılar!

Stanford Üniversitesi ve Washington Üniversitesi’nden araştırmacılar, sadece 26 dakika içinde ve 50 dolardan daha az bir maliyetle OpenAI’ın gelişmiş modellerine rakip bir yapay zeka modelini eğitmeyi başardı. s1 olarak isimlendirilen bu model, 1.000 sorudan oluşan küçük bir data seti ile eğitildi ve büyük yapay zeka modellerinin bilgisini küçük modellere aktaran distilasyon (distillation) prosedürü ile geliştirildi.
50 dolarlık OpenAI rakibi yapay zeka: s1
Araştırmacılar, s1’in mantık yürütme yeteneklerini geliştirmek için Google’ın Gemini 2.0 Flash Thinking Experimental modelinden yararlandı. Lakin Google’ın hizmet kaideleri Gemini API’sinin rakip yapay zeka modellerinin geliştirilmesi için kullanılmasını yasaklıyor ve bu durum mümkün hukuksal meseleleri gündeme getiriyor.

s1 modeli, Alibaba Cloud’un açık kaynaklı Qwen2.5 modeli üzerine inşa edildi. Başlangıçta 59.000 soruluk büyük bir bilgi seti kullanılarak eğitime başlansa da yapılan testler daha küçük bir bilgi setinin emsal doğruluk oranlarını sunduğunu ortaya koydu ve böylelikle eğitim mühleti ve maliyet kıymetli ölçüde düşürüldü.

Çin, Trump vergileri yüzünden Apple’a acımayacak!
Çin, Apple’ın App Store siyasetlerini inceliyor. ABD-Çin ticaret gerginliği tırmanırken şirketlerde son durum ne?
Eğitim süreci 16 adet Nvidia H100 GPU kullanılarak tamamlandı. Model, doğruluğunu artırmak için test-time scaling ismi verilen gelişmiş bir teknikten yararlanıyor. Araştırmacılar, modele “Wait” komutu ekleyerek karşılık üretme müddetini uzattı ve böylelikle modelin cevaplarını tekrar gözden geçirip yanlışlarını düzeltmesine imkan tanıdı. Bu usul, yapay zekanın karmaşık mantık süreçlerini daha gerçek çalıştırmasını sağladı.
Bu gelişme, yüksek performanslı yapay zeka modellerinin kesinlikle milyarlarca dolarlık yatırımlarla ve devasa data merkezleriyle eğitilmesi gerekmediğini kanıtlıyor. OpenAI’ın o1 modeli de emsal bir mantık yürütme tekniği kullanıyor ve Çin merkezli DeepSeek’in R1 modeli, misal bir prosedürle çok daha düşük maliyetle geliştirildiğini argüman ediyor.
Ancak OpenAI, DeepSeek’i modellerinden bilgi distile ederek rakip bir yapay zeka geliştirmekle suçladı ve bu durum büyük teknoloji şirketlerinin açık kaynak yapay zeka modelleri karşısındaki duruşlarını yine gözden geçirmelerine neden olabilir.