DeepSeek V3.1 Modelini Yayımladı: Yenilikler Neler?
DeepSeek V3.1 Modelini Yayımladı: Yenilikler Neler?
Çinli yapay zeka şirketi DeepSeek, amiral gemisi büyük dil modelinin 3.1 sürümünü yayınladı. Bu sürüm, bağlam penceresini 128.000 token'a ve parametre sayısını 685 milyara çıkardı. Güncelleme, 19 Ağustos'ta şirketin WeChat kullanıcı grubu aracılığıyla sessizce duyuruldu ve resmi sosyal medya kanallarında herhangi bir paylaşım yapılmadı.
Ne var ne yok?
DeepSeek V3.1'deki en önemli değişiklik , modelin artık 300 ila 400 sayfalık bir kitaba eşdeğer girdileri işleyebilmesini sağlayan artırılmış bağlam uzunluğudur. Bu iyileştirme, uzun biçimli içerik oluşturma, teknik belge analizi ve genişletilmiş çok turlu konuşmalarda daha iyi performans sağlar. Resmi ekip, genişletilmiş bağlamın önceki V3 sürümünde zaten dahili olarak desteklendiğini, ancak artık tüm arayüzlerde resmi olarak etkinleştirildiğini doğruladı.
Uzman Karışımı ve Kıyaslama Puanları
DeepSeek V3.1, token başına yalnızca 37 milyar parametrenin etkinleştirildiği bir Uzmanlar Karışımı (MoE) mimarisini kullanmaya devam ediyor. Model, BF16, FP8 ve F32 dahil olmak üzere birden fazla hassasiyet formatını destekleyerek farklı dağıtım ortamları için daha fazla esneklik sağlıyor. Geliştiriciler, modele API aracılığıyla erişebilir veya MIT açık kaynak lisansı altında Hugging Face'ten indirebilirler.
Geliştirilmiş model, erken dönem üçüncü taraf kıyaslamalarında iyi performans gösterdi. Aider kodlama testinde %71,6 puan alarak Claude Opus 4'ün üzerine çıktı ve şu anda mevcut en güçlü açık kaynaklı kodlama modellerinden biri haline geldi. DeepSeek V3.1 ayrıca matematik ve mantık görevlerinde gelişmiş performans gösterdi. Ancak bazı kullanıcılar, önceki R1-0528 modeline kıyasla muhakemede belirgin bir ilerleme kaydetmediğini belirtti.
Stratejide Değişim
DeepSeek, sohbet robotu arayüzünden R1 modeline yapılan tüm atıfları kaldırarak, tek bir hibrit model mimarisine geçiş sinyali verdi. Şirket, ayrı bir akıl yürütme modeli sürdürmek yerine, akıl yürütme yeteneklerini V3.1'e entegre etmiş gibi görünüyor.
V3.1'in eğitim maliyeti henüz açıklanmadı. Ancak önceki raporlara göre, orijinal V3 modeli, Nvidia H800 yongaları kullanılarak 2,788 milyon GPU saati üzerinde eğitilmiş ve tahmini maliyeti 5,6 milyon dolardı. Bu model, muhtemelen ek iyileştirmelerle benzer bir altyapıyı paylaşan mevcut sürümün temelini oluşturuyordu.
Gecikmeli R2 Modeli Etrafındaki Karışıklık
DeepSeek'in bir sonraki büyük sürümünün, akıl yürütme yeteneklerini geliştirmek üzere tasarlanmış, uzun zamandır beklenen R2 modeli olacağı yaygın bir beklentiydi . Ancak şirketin bir sonraki adımı olarak V3.1 ortaya çıktı. Yakın tarihli bir Financial Times haberine göre, R2 modelinin piyasaya sürülmesi, Huawei'
Bu arada, Alibaba'nın Qwen3 gibi rakipleri, daha verimli bir yürütme sağlayan benzer algoritmalar kullanarak öne geçti. Bu olay, Çin'in yerel çip altyapısının sınırlarını ve aynı anda hem siyasi hem de teknik talepleri karşılamaya çalışan girişimlerin karşılaştığı zorlukları vurguladı.
DeepSeek, R2'nin piyasaya sürülme olasılığını göz ardı etmiyor. Ancak, model ne zaman piyasaya sürülürse sürülsün, performansı yoğun bir incelemeye tabi tutulacak. O zamana kadar, V3.1, şirketin mevcut amiral gemisi olarak varlığını sürdürüyor ve hem akıl yürütme hem de akıl yürütme dışı iş yüklerini tek bir çatı altında sunuyor.
nin Ascend AI yongalarındaki devam eden teknik sorunlar nedeniyle ertelendi .
DeepSeek'in, Çin'in yapay zeka öz yeterliliğine yönelik ulusal stratejisiyle uyumlu olarak Nvidia'ya bağımlılığını azaltmak için Ascend donanımını kullanması yönünde teşvik edildiği bildirildi. Huawei mühendislerinin desteğine rağmen, Ascend eğitimi uyumluluk ve performans sorunları nedeniyle başarısız oldu. Şirket daha sonra çıkarım için Ascend'i korurken eğitim için Nvidia GPU'larını kullanmaya başladı. Bu hibrit kurulum, daha fazla karmaşıklığa ve gecikmeye yol açtı. Ayrıca, veri etiketlemeye harcanan uzun süre, geliştirmeyi yavaşlattı. DeepSeek kurucusu Liang Wenfeng'in yavaş ilerlemeden duyduğu hayal kırıklığını dile getirdiği bildirildi.
Tepkiniz Nedir?
Beğen
0
Beğenme
0
Aşk
0
Eğlenceli
0
Sinirli
0
Üzgün
0
Vay
0