OpenAI'nin son LLM programı Çin'in yapay zeka girişimlerine kapı açıyor



Özet


Apsara Konferansı'nda Çin'in yapay zeka şirketleri, Microsoft destekli OpenAI'nin en son büyük dil modellerini (LLM) geliştirmeye odaklandı. Konferansta, o1 modelinin bilim, kodlama ve matematik alanlarında ilerleme sağlayarak çeşitli sektörleri yeniden şekillirme potansiyeli vurgulandı. Moonshot AI'ın kurucusu Zhilin, ölçeklendirme yasasının önemine dikkat çekerek, daha büyük modellerin daha iyi performans gösterdiğini belirtti. Ancak StepFun CEO'su Daxin, ABD ticaret kısıtlamaları nedeniyle hesaplama gücünün Çinli girişimler için zorluk oluşturmaya devam ettiğini belirtti.




Alibaba Cloud tarafından Hangzhou'da düzenlenen Apsara Konferansı'nda, Çin'in yapay zeka (YZ) girişimleri, büyük dil modelleri geliştirme çabalarını vurguladı.

Şirketlerin bu çabaları, Microsoft destekli o1 üretken önceden eğitilmiş dönüştürücü modeli de dahil olmak üzere OpenAI'nin en son LLM'lerinin duyurulmasını takip ediyor. Modelin, bilim, kodlama ve matematik alanlarında ilerlemelerin önünü açarak zorlu görevlerin üstesinden gelmesi amaçlanıyor.

Konferans sırasında, Moonshot AI'ın kurucusu Kunal Zhilin, o1 modelinin önemini vurgulayarak, modelin çeşitli sektörleri yeniden şekillendirme ve YZ girişimleri için yeni fırsatlar yaratma potansiyeline sahip olduğunu ekledi.

Zhilin, pekiştirmeli öğrenmenin ve ölçeklenebilirliğin YZ geliştirme için çok önemli olabileceğini belirtti. Daha fazla eğitim verisiyle daha büyük modellerin daha iyi performans gösterdiğini belirten ölçeklendirme yasasından bahsetti.

Zhilin, "Bu yaklaşım, YZ yeteneklerinin tavanını zorluyor" dedi ve OpenAI o1'in sektörleri sarsma ve girişimler için yeni fırsatlar yaratma potansiyeline sahip olduğunu ekledi.

OpenAI ayrıca, modelin insan düşüncesine benzer bir şekilde işleyen karmaşık problemleri çözme yeteneğini de vurguladı. Stratejilerini geliştirerek ve hatalarından ders çıkararak, model problem çözme yeteneklerini geliştirir.

Zhilin, yeterli hesaplama gücüne sahip şirketlerin yalnızca algoritmalarla değil, temel YZ modelleriyle de yenilik yapabileceğini söyledi. Bunu önemli olarak görüyor, çünkü YZ mühendisleri mevcut organik veri kaynakları tükendikten sonra yeni veri üretmek için giderek daha fazla pekiştirmeli öğrenmeye güveniyor.

StepFun CEO'su Jiang Daxin, Zhilin'e katıldı ancak, özellikle Çinli işletmelerin gelişmiş yarı iletkenlere erişimini engelleyen ABD ticaret kısıtlamaları nedeniyle, hesaplama gücünün birçok girişim için büyük bir zorluk olmaya devam ettiğini belirtti.

Daxin, "Hesaplama gereksinimleri hala önemli düzeyde" dedi.

Baichuan AI'den bir kaynak, Moonshot AI, Baichuan AI, Zhipu AI ve MiniMax dahil olmak üzere, yalnızca küçük bir grup Çinli YZ girişiminin pekiştirmeli öğrenmeye büyük ölçekli yatırımlar yapabilecek konumda olduğunu söyledi. Toplu olarak "YZ kaplanları" olarak adlandırılan bu şirketler, bir sonraki nesil YZ'yi zorlayarak, LLM geliştirmeye yoğun olarak dahil oluyorlar.

Apsara Konferansı'ndan daha fazlası

Ayrıca konferansta, Alibaba Cloud, kodlama ve matematik alanlarında ilerlemeler sunan Qwen 2.5 model ailesinin piyasaya sürülmesi de dahil olmak üzere çeşitli duyurular yaptı. Modeller, 0,5 milyardan 72 milyar parametreye kadar uzanıyor ve Çince, İngilizce, Fransızca ve İspanyolca dahil olmak üzere yaklaşık 29 dili destekliyor.

Qwen2.5-Coder ve Qwen2.5-Math gibi uzmanlaşmış modeller, Hugging Face ve ModelScope platformlarında 40 milyondan fazla indirme ile şimdiden bir miktar ilgi gördü.

Alibaba Cloud, ürün portföyüne, Tongyi Wanxiang resim oluşturucusunda bir metinden videoya model sunarak ekleme yaptı. Model, reklamcılık ve film yapımcılığında olası kullanımlarla, gerçekçi ve animasyonlu stillerde videolar oluşturabiliyor.

Alibaba Cloud, en son versiyon olan Qwen 2-VL'yi tanıttı.