DeepSeek V3.1 duyuruldu: İşte performansı

Çinli yapay zeka teşebbüsü DeepSeek, 685 milyar parametreye sahip yeni modeli DeepSeek V3.1’i sessizce yayınladı. Şirket, High-Flyer Capital Management’ın takviyesiyle geliştirdiği bu modeli, büyük bir lansman yapmadan direkt Hugging Face platformuna yükledi.
DeepSeek V3.1 görücüye çıktı
Bu atılım birinci bakışta gösterişsiz dursa da, kısa müddette yapılan testler modelin OpenAI ve Anthropic üzere devlerin en gelişmiş sistemleriyle rahatça rekabet edebildiğini ortaya çıkardı. Modelin açık kaynak olması, coğrafik yahut politik kısıtlamalara takılmadan tüm dünyada erişilebilir olmasını sağlıyor.

DeepSeek V3.1’in gelişi, yalnızca bir teknolojik ilerleme değil, tıpkı vakitte yapay zekanın geliştirilmesi, dağıtımı ve denetimi konusunda esaslı bir değişimin de habercisi. Bu durum, ABD ile Çin ortasındaki teknoloji rekabetini yeni bir boyuta taşıyor.
DeepSeek V3.1, yüzde 71,6’lık Aider kodlama puanıyla Amerikan rakiplerine direkt meydan okuyor. Yaklaşık 400 sayfalık bir kitaba denk gelen 128.000 token’a kadar bağlamı işleyebiliyor ve karşılık mühletleri evvelki “düşünen” modellerden daha süratli.
Sistem, BF16’dan deneysel FP8’e kadar çeşitli hassasiyet formatlarını destekleyerek geliştiricilerin donanımlarına nazaran optimizasyon yapmasına imkan tanıyor. Şirket, bu modelin Çin imali çiplere optimize edilebilen bir özelliğe sahip olduğunu ve daha yüksek süreç performansı sunduğunu söylüyor.
Modelin en dikkat alımlı tarafı ise “hibrit mimari” olarak isimlendirdikleri yaklaşımda kapalı. V3.1, sohbet, mantıksal çıkarım ve kodlama yeteneklerini tek bir sistemde birleştirerek dengeli ve yüksek performanslı bir sonuç sunuyor. Yapay zeka araştırmacısı Andrew Christianson’a nazaran, DeepSeek V3.1, Claude Opus 4’ten yüzde 1 daha yeterli performans gösterirken maliyeti 68 kat düşürüyor.
Modelin mimarisinde gerçek vakitli web entegrasyonu için arama tokenları ve içsel mantık yürütme için düşünme tokenları da bulunuyor. Bu özellikler, daha evvel hibrit sistemlerde yaşanan temel sıkıntıların aşıldığını gösteriyor.

DeepSeek V3.1, verimlilik konusunda da etkileyici bir tablo çiziyor. Tam bir kodlama vazifesi için yaklaşık 1,01 dolarlık bir maliyetle, 70 dolar civarında maliyet çıkaran rakip sistemlerle karşılaştırılabilir sonuçlar veriyor. Günlük binlerce yapay zeka etkileşimine gereksinim duyan şirketler için bu maliyet farkı, milyonlarca dolarlık potansiyel bir tasarruf demek.
Açık kaynak erişimini sürdüren DeepSeek, ABD merkezli şirketlerin iş modellerine direkt meydan okuyor. ABD’li firmalar modellerini yüksek lisans fiyatları ve kullanım kısıtlamalarıyla korurken, DeepSeek misal yeteneklere fiyatsız erişim imkanı sunuyor. Bu durum, yapay zeka pazarındaki rekabeti daha da kızıştırıyor.