
DeepSeek V3-0324, açık kaynaklı ilk akıl yürütmeyen yapay zeka modellerini geride bıraktı
Özet
DeepSeek V3-0324, açık kaynaklı bir yapay zeka modeli olarak, muhakeme yeteneği olmayan modeller arasında Yapay Analiz Zeka İndeksi'nde en yüksek puanı alarak önemli bir başarı elde etti. Bu model, Google'ın Gemini 2.0 Pro'su ve Meta'nın Llama 3.3 70B'si gibi rakiplerini geride bırakarak anlık yanıtların kritik olduğu uygulamalar için açık kaynaklı çözümlerin uygulanabilirliğini artırıyor. DeepSeek V3-0324, 128k bağlam penceresi ve 671 milyar parametre gibi özelliklere sahip olmakla birlikte, kurumsal düzeyde bir altyapı gerektiriyor. Bu başarı, açık kaynaklı yapay zekanın gelişimi için önemli bir adım olarak kabul ediliyor.
DeepSeek V3-0324, açık kaynaklı yapay zeka için bir dönüm noktası başarısı olarak, Yapay Analiz Zeka İndeksi'nde, muhakeme yeteneği olmayan modeller arasında en yüksek puanı elde etti.
Yeni model, Google'ın Gemini 2.0 Pro'su, Anthropic'in Claude 3.7 Sonnet'i ve Meta'nın Llama 3.3 70B'si gibi tescilli rakiplerini geride bırakarak, ölçütlerde yedi puanlık bir ilerleme kaydetti.
V3-0324, DeepSeek'in kendi R1'i ve OpenAI ile Alibaba'nın sundukları gibi muhakeme modellerinin gerisinde kalsa da, bu başarı, anında yanıtların kritik olduğu, gecikmeye duyarlı uygulamalarda açık kaynaklı çözümlerin artan uygulanabilirliğini vurgulamaktadır.
DeepSeek V3-0324, açık kaynaklı yapay zeka için yeni bir çağın temsilcisi
"Düşünme" aşamaları olmaksızın anında yanıtlar üreten muhakeme yeteneği olmayan modeller, sohbet robotları, müşteri hizmetleri otomasyonu ve canlı çeviri gibi gerçek zamanlı kullanım durumları için elzemdir. DeepSeek'in en son sürümü artık bu uygulamalar için standardı belirliyor ve önde gelen tescilli araçları bile geride bırakıyor.
Yapay Analiz, "Bu, açık ağırlıklı bir modelin, açık kaynak için bir kilometre taşı olan, önde gelen muhakeme yeteneği olmayan model olduğu ilk sefer," diye belirtiyor. Modelin performansı, onu karmaşık problem çözme gerektiren görevler için daha üstün kalmaya devam eden tescilli muhakeme modellerine yaklaştırıyor.
DeepSeek V3-0324, Aralık 2024'teki selefinin özelliklerinin çoğunu koruyor, bunlar arasında:
128k bağlam penceresi (DeepSeek'in API'si aracılığıyla 64k ile sınırlandırılmıştır)
671 milyar toplam parametre, FP8 hassasiyeti için 700GB'tan fazla GPU belleği gerektirmektedir
37 milyar aktif parametre
Yalnızca metin işlevi (çok modlu destek yok)
MIT Lisansı
Yapay Analiz, "Hala evde çalıştırabileceğiniz bir şey değil!" diye takılarak, kurumsal düzeydeki altyapı gereksinimlerini vurguluyor.
Açık kaynaklı yapay zeka ateşi getiriyor
DeepSeek R1 gibi tescilli muhakeme modelleri, daha geniş Zeka İndeksi'nde hakimiyetini korurken, aradaki fark daralıyor.
Üç ay önce, DeepSeek V3, Anthropic ve Google'ın tescilli modellerine neredeyse yaklaştı ancak onları geçmeyi başaramadı. Bugün, güncellenen V3-0324 yalnızca açık kaynaklı alternatiflere liderlik etmekle kalmıyor, aynı zamanda tüm tescilli muhakeme yeteneği olmayan rakiplerinden daha iyi performans gösteriyor.
Yapay Analiz, "Bu sürüm, R1'den bile daha etkileyici," diyor.
DeepSeek'in ilerlemesi, açık kaynaklı çerçevelerin kapalı sistemlerle giderek daha fazla rekabet ettiği yapay zeka sektöründe bir değişimin sinyalini veriyor. Geliştiriciler ve işletmeler için, MIT lisanslı V3-0324, güçlü ve uyarlanabilir bir araç sunuyor; ancak, hesaplama maliyetleri erişilebilirliği sınırlayabilir.
Yapay Analiz, "DeepSeek artık muhakeme yeteneği olmayan açık ağırlıklı modellerin sınırlarını zorluyor," diye belirtiyor.
R2 ufukta görünürken, topluluk yapay zeka performansında başka bir potansiyel sıçramayı bekliyor.
(Fotoğraf: Paul Hanaoka)
Ayrıca bkz: Hugging Face, Yapay Zeka Eylem Planı'nda açık kaynaklı odaklanma çağrısında bulunuyor
Yapay zeka ve büyük veri hakkında endüstri liderlerinden daha fazla bilgi edinmek ister misiniz? Amsterdam, Kaliforniya ve Londra'da gerçekleşen Yapay Zeka ve Büyük Veri Fuarı'nı inceleyin. Kapsamlı etkinlik, diğer önde gelenlerle birlikte düzenleniyor.