Deep Cogito v2: Muhakeme becerilerini geliştiren açık kaynaklı yapay zeka



Özet


Deep Cogito, muhakeme yeteneklerini geliştiren yeni bir açık kaynaklı yapay zeka modeli ailesi olan Cogito v2'yi piyasaya sürdü. Bu yeni seri, en büyüğü olan 671B parametreli model de dahil olmak üzere dört hibrit model içeriyor ve açık kaynaklı rakipleriyle rekabet ediyor. Cogito v2, yanıtlar bulmak için daha uzun "düşünmek" yerine kendi muhakeme süreçlerini içselleştirerek çalışıyor. Bu içselleştirilmiş muhakeme, modellerin performansını artırırken maliyeti de düşürüyor ve geliştirme maliyeti 3,5 milyon doların altında kalıyor.




Deep Cogito, kendi muhakeme becerilerini geliştiren yeni bir açık kaynaklı yapay zeka modeli ailesi olan Cogito v2'yi yayınladı.

Açık kaynak lisansı altında yayınlanan yeni Cogito v2 serisi, dört hibrit muhakeme yapay zeka modeli içeriyor: 70B ve 109B parametrelerinde iki orta ölçekli model ve 405B ve 671B'de iki büyük ölçekli versiyon.

En büyüğü olan 671B Uzman Karışımı (MoE) modeli, şimdiden dünyanın en güçlü açık kaynaklı yapay zekalarından biri olarak lanse ediliyor. Şirket, DeepSeek'in en yenisiyle rekabet ettiğini ve O3 ve Claude 4 Opus gibi tescilli sistemlerle arasındaki farkı kapattığını bildiriyor.

Ancak asıl hikaye sadece boyut veya güçle ilgili değil; yapay zekanın nasıl öğrendiğindeki temel bir değişimle ilgili. Cogito v2, bir yanıt bulmak için sadece çıkarım zamanında daha uzun "düşünmek" yerine, kendi muhakeme süreçlerini içselleştirmek üzere tasarlanmıştır.

Bu içselleştirilmiş muhakeme, Yinelemeli Damıtma ve Güçlendirme (IDA) adı verilen bir teknikle elde edilir; bu teknik, bir aramadan elde edilen keşifleri modelin temel parametrelerine damıtır. Amaç, daha güçlü bir "sezgi" oluşturarak, modelin tüm aramayı yapmak zorunda kalmadan kendi muhakemesinin sonucunu tahmin etmesini sağlamaktır.

Açık kaynaklı yapay zeka modelleri, doğru yaklaşım için daha iyi bir "içgüdüye" sahip olduğundan, muhakeme zincirleri Deepseek R1 gibi rakiplerine göre %60 daha kısadır.

Bu verimlilik bütçeye de yayılıyor. Deep Cogito, tüm modellerini – denemelerden son eğitime kadar – toplamda 3,5 milyon dolardan daha az bir maliyetle geliştirdiğini söylüyor. Bu, sizin veya benim için muhtemelen büyük bir meblağ olsa da, önde gelen birçok yapay zeka laboratuvarının harcamalarına kıyasla minik kalıyor.

Amiral gemisi 671B modeli özel ilgi gördü; sadece nihai cevaplarını iyileştirmek için değil, aynı zamanda düşünme sürecinin kendisini de geliştirmek için eğitildi. Bu yaklaşım, modelin "sürüklenmesini" engeller ve çözüme daha doğrudan bir yolu ödüllendirir. Performans verileri bunun işe yaradığını gösteriyor; Deep Cogito'nun açık kaynaklı yapay zeka modeli, temel ölçütlerde en son DeepSeek versiyonlarına eşit veya onları aşarken, tescilli alternatiflere yakın performans sergiliyor:

Belki de en şaşırtıcı sonuçlardan biri, modellerin görüntüler hakkında akıl yürütme yeteneğidir; bunun için asla açıkça eğitilmedikleri bir beceri.

Ekip, Deep Cogito'nun açık kaynaklı yapay zeka modelinin bir ördek ve bir aslanın iki görüntüsünü karşılaştırdığı, yaşam alanları, renkleri ve kompozisyonları hakkında tamamen transfer öğrenme yoluyla derin bir düşünme süreci sergilediği bu muhakemenin bir örneğini paylaştı. Deep Cogito, bu ortaya çıkan özelliğin, gelecekteki çok modlu muhakeme sistemleri için önyükleme eğitim verisi için güçlü bir yol olabileceğine inanıyor.

İleriye dönük olarak, Deep Cogito ekibi, süper zeka oluşturma arayışında "yinelemeli kendi kendini geliştirmenin kazanımları üzerinde tepe tırmanışı" yapmayı planlıyor. Oluşturdukları tüm yapay zeka modellerinin açık kaynak olacağına dair taahhütlerini yinelediler.

Ayrıca bakınız: Sızıntı, OpenAI'nin açık kaynaklı yapay zeka modelinin yakında yayınlanacağını gösteriyor

Yapay zeka ve büyük veri hakkında sektör liderlerinden daha fazla bilgi edinmek ister misiniz? AI & Big Data Expo'ya göz atın