DeepSeek-V3-0324 resmen tanıtıldı! İşte tüm yenilikler

Çin merkezli yapay zeka teşebbüsü DeepSeek, MIT lisansı ile yayınladığı yeni büyük lisan modeli DeepSeek-V3-0324’ü kullanıcıların erişimine açtı. Model, Hugging Face platformunda fiyatsız olarak indirilebiliyor ve ticari kullanım için de büsbütün açık durumda.

Yeni DeepSeek-V3-0324 görücüye çıktı

641 gigabayt boyutundaki model, bilhassa tüketici sınıfı donanımlarda çalışabilir olmasıyla dikkat çekiyor. Apple’ın M3 Ultra çipine sahip Mac Studio aygıtlarında bile sıkıntısız formda çalıştığı belirtilen teknoloji, 685 milyar parametreli bir yapıya sahip.

https://twitter.com/hakki_alkan/status/1904553879250804899

Yapay zeka araştırmacısı Xeophon, bu modelin Anthropic’in Claude Sonnet 3.5 modeline önemli bir rakip olabileceğini belirtiyor. Bilhassa Sonnet’in abonelikle sunulmasının bilakis, DeepSeek-V3-0324’ün büsbütün fiyatsız bir halde erişilebilir olması büyük fark yaratacak.

deepseek v3 0324 resmen tanitildi iste tum yenilikler 0 u3IzEHIB

ChatGPT kullanmak yalnızlık hissini artırıyor! Pekala neden?

Yapılan bir araştırmaya nazaran, ChatGPT kullanmak kimi bireylerde yalnızlık hissini artırıyor. Bu durum, birçok kaygıya yol açtı.

Model, Mixture of Experts (MoE) mimarisine dayanıyor. Klasik büyük lisan modellerinin bilakis, DeepSeek-V3-0324 sadece en gerekli parametreleri aktifleştiriyor. 685 milyar parametreden sırf yaklaşık 37 milyarı etkin hale getiriliyor.

Bu yaklaşım, hesaplama müddetini önemli formda azaltırken performanstan da ödün vermiyor. Performans testlerinde, daha büyük ve daha ağır aktifleştirme yapan modellerle hayli emsal sonuçlar elde edildi.

DeepSeek-V3-0324 ayrıyeten Multi-Head Latent Attention (MLA) ve Multi-Token Prediction (MTP) üzere iki değerli yenilik içeriyor. MLA, uzun metinler ortasında bağlamı muhafaza yeteneğini geliştirirken, MTP her adımda birden fazla token üretme imkanı sağlıyor.

Bu teknolojiler, modelin çıktı suratını yaklaşık yüzde 80 oranında artıracak. Apple araştırma kümesinden Awni Hannun, modeli Mac Studio üzerinde test ederek saniyede yaklaşık 20 token suratında çıktı ürettiklerini açıkladı.

Kullanıcılar, modelin bağlantı biçiminde evvelki sürümlere kıyasla besbelli bir değişiklik olduğunu belirtiyor. Daha evvel insan gibisi ve konuşkan bir tona sahip olan DeepSeek modellerinin bilakis, V3-0324 daha resmi ve teknik bir üsluba sahip.

OKU:  Xiaomi YU7 SUV resmen tanıtıldı! İşte özellikleri

DeepSeek’in bu atılımı, büyük lisan modelleri ortasındaki rekabeti yeni bir boyuta taşıdı. Pekala siz bu husus hakkında ne düşünüyorsunuz? Görüşlerinizi aşağıdaki yorumlar kısmından bizimle paylaşabilirsiniz.

İlginizi Çekebilir:Honor MagicPad 3, 16 GB RAM ile globalde tanıtıldı!
share Paylaş facebook pinterest whatsapp x print

Benzer İçerikler

galaxy z flip fe icin geri sayim fiyati ortaya cikti lb3qrGqY
Galaxy Z Flip FE için geri sayım: Fiyatı ortaya çıktı!
son teknoloji yeni bolum yayinlaniyor mZJxOHvY
SON Teknoloji yeni bölüm yayınlanıyor
mobil pazarlamada yeni donem mobileaction ve skai guclerini birlestirdi
Mobil pazarlamada yeni dönem: MobileAction ve Skai güçlerini birleştirdi
john wick yonetmeni ve netflix sifu filmi icin anlasti 7IOFFjzV
John Wick yönetmeni ve Netflix, Sifu filmi için anlaştı!
2025 yilinin en degerli markalari belli oldu 4Q6ImVku
2025 yılının en değerli markaları belli oldu!
dunyanin en hizli oled monitoru tanitildi puCwZiHE
Dünyanın en hızlı OLED monitörü tanıtıldı
Bahis Sitesi | © 2025 |