Ant Group'un trilyon parametreli yapay zeka modeli, ikili yayın stratejisiyle akıl yürütme ölçütlerini hedefliyor



Özet


Ant Group, yeni açık kaynaklı dil modeli Ling-1T ile trilyon parametreli yapay zeka model arenasına girdi. Model, matematiksel muhakeme görevlerinde başarılı performans sergileyerek AIME ölçütünde %70,42 doğruluk oranına ulaştı. Ling-1T, aynı zamanda, dInfer adlı özel bir çıkarım çerçevesinin lansmanı ile birlikte piyasaya sürüldü. Bu paralel sürüm stratejisi, Ant Group'un farklı teknolojik yaklaşımlara yatırım yaptığını gösteriyor ve yaygın modellerdeki verimliliği artırmayı hedefliyor.




Ant Group, Çinli fintech devi tarafından gelişmiş muhakeme yetenekleri ile hesaplama verimliliğini dengelemede bir atılım olarak konumlandırılan, yeni açık kaynaklı bir dil modeli olan Ling-1T ile trilyon parametreli yapay zeka modeli arenasına girdi.

9 Ekim'deki duyuru, birden fazla model mimarisi genelinde yapay zeka altyapısını hızla geliştiren Alipay operatörü için önemli bir dönüm noktası oluşturuyor.

Trilyon parametreli yapay zeka modeli, karmaşık matematiksel muhakeme görevlerinde rekabetçi bir performans sergileyerek, yapay zeka sistemlerinin problem çözme yeteneklerini değerlendirmek için kullanılan bir standart olan 2025 Amerikan Davetli Matematik Sınavı (AIME) ölçütünde %70,42 doğruluk oranına ulaştı.

Ant Group'un teknik özelliklerine göre, Ling-1T, bu performans seviyesini korurken, problem başına ortalama 4.000'in üzerinde çıktı belirteci tüketiyor ve bu da onu, şirket tarafından sonuç kalitesi açısından "sınıfının en iyisi yapay zeka modelleri" olarak tanımlanan modellerle aynı seviyeye yerleştiriyor.

Yapay zeka gelişimine çift yönlü yaklaşım

Trilyon parametreli yapay zeka modelinin piyasaya sürülmesi, Ant Group'un yaygın dil modelleri için tasarlanmış özel bir çıkarım çerçevesi olan dInfer'in lansmanıyla aynı zamana denk geliyor. Bu paralel sürüm stratejisi, şirketin tek bir mimari paradigmden ziyade birden fazla teknolojik yaklaşıma yönelik bahsini yansıtıyor.

Yaygın dil modelleri, ChatGPT gibi yaygın olarak kullanılan sohbet robotlarının temelini oluşturan otomatik gerilemeli sistemlerden bir ayrılışı temsil ediyor. Sıralı metin üretimi yerine, yaygın modeller çıktıları paralel olarak üretir; bu, görüntü ve video oluşturma araçlarında zaten yaygın olan ancak dil işlemede daha az görülen bir yaklaşımdır.

Ant Group'un dInfer için performans ölçütleri önemli verimlilik artışlarına işaret ediyor. Şirketin LLaDA-MoE yaygın modelinde yapılan testler, Nvidia'nın Fast-dLLM çerçevesinde saniyede 91 belirteç ve vLLM altyapısında çalışan Alibaba'nın Qwen-2.5-3B modeli için saniyede 294 belirteç karşılığında, HumanEval kodlama ölçütünde saniyede 1.011 belirteç üretti.

Ant Group'taki araştırmacılar, ilgili teknik dokümantasyonda, "dInfer'in hızla büyüyen yaygın dil modelleri (dLLM'ler) alanında araştırma ve geliştirmeyi hızlandırmak için hem pratik bir araç seti hem de standart bir platform sağladığına inanıyoruz." dediler.

Dil modellerinin ötesinde ekosistem genişlemesi

Ling-1T trilyon parametreli yapay zeka modeli, Ant Group'un son aylarda bir araya getirdiği daha geniş bir yapay zeka sistemleri ailesinin içinde yer alıyor.

Şirketin portföyü artık üç ana seriye yayılıyor: standart dil görevleri için Ling düşünmeyen modelleri, karmaşık muhakeme için tasarlanmış Ring düşünme modelleri (daha önce piyasaya sürülen Ring-1T-preview dahil) ve görüntüleri, metni, sesi ve videoyu işleyebilen Ming çok modlu modelleri.

Bu çeşitlendirilmiş yaklaşım, Mixture-of-Experts (MoE) mimarisini kullanan ve belirli görevler için yalnızca büyük bir modelin ilgili bölümlerini etkinleştiren, teorik olarak verimliliği artıran deneysel bir model olan LLaDA-MoE'ye kadar uzanıyor.

Ant Group'un teknoloji direktörü He Zhengyu