Huawei Supernode 384, Nvidia'nın yapay zeka pazarındaki hakimiyetini bozuyor


Huawei'nin yapay zeka yetenekleri, şirketin Supernode 384 mimarisiyle bir atılım yaparak, ABD-Çin teknoloji gerginlikleri ortasında küresel işlemci savaşlarında önemli bir an yaratmıştır.

Çinli teknoloji devinin en son yeniliği, şirketin yöneticilerinin, ABD liderliğindeki sıkı ticaret kısıtlamaları altında faaliyet göstermeye devam ederken, bilgi işlem çerçevesinin Nvidia'nın uzun süredir devam eden pazar hakimiyetine nasıl doğrudan meydan okuduğunu gösterdiği, Shenzhen'deki geçen Cuma günkü Kunpeng Ascend Geliştirici Konferansı'ndan ortaya çıktı.

Zorunluluktan doğan mimari yenilik

Huawei'nin Ascend bilgi işlem işinin başkanı Zhang Dixuan, konferans açılış konuşmasında yeniliği yönlendiren temel sorunu dile getirdi: "Paralel işleme ölçeği büyüdükçe, geleneksel sunucu mimarilerindeki makineler arası bant genişliği, eğitim için kritik bir darboğaz haline geldi."

Supernode 384, modern yapay zeka iş yükleri için özel olarak tasarlanmış bir eşler arası mimari lehine Von Neumann bilgi işlem prensiplerini terk ediyor. Bu değişiklik, Özellikle Mixture-of-Experts modelleri (karmaşık hesaplama zorluklarını çözmek için birden fazla uzmanlaşmış alt ağ kullanan makine öğrenimi sistemleri) için özellikle güçlüdür.

Huawei'nin CloudMatrix 384 uygulaması etkileyici teknik özellikler sergiliyor: 12 bilgi işlem kabini ve dört otobüs kabinine yayılan 384 Ascend yapay zeka işlemcisi, 48 terabayt yüksek bant genişliğine sahip bellek ile eşleştirilmiş 300 petaflops ham hesaplama gücü üretiyor ve entegre yapay zeka bilgi işlem altyapısında bir sıçramayı temsil ediyor.

Performans metrikleri sektör liderlerine meydan okuyor

Gerçek dünya kıyaslama testleri, sistemin yerleşik çözümlerle karşılaştırıldığında rekabetçi konumunu ortaya koyuyor. Meta'nın LLaMA 3 gibi yoğun yapay zeka modelleri, Supernode 384'te kart başına saniyede 132 token'a ulaştı - geleneksel küme mimarilerine kıyasla 2,5 kat daha üstün performans sunuyor.

İletişim yoğun uygulamalar daha da dramatik iyileştirmeler gösteriyor. Alibaba'nın Qwen ve DeepSeek ailelerinden modeller, kart başına saniyede 600 ila 750 token'a ulaşarak, mimarinin yeni nesil yapay zeka iş yükleri için optimizasyonunu ortaya koyuyor.

Performans artışları, temel altyapı yeniden tasarımlarından kaynaklanmaktadır. Huawei, geleneksel Ethernet ara bağlantılarının yerini yüksek hızlı otobüs bağlantılarıyla değiştirerek, tek atlamalı gecikmeyi 2 mikrosaniyeden 200 nanosaniyeye düşürürken - on kat iyileştirme - iletişim bant genişliğini 15 kat artırdı.

Jeopolitik strateji teknik yeniliği yönlendiriyor

Supernode 384'ün gelişimi, daha geniş ABD-Çin teknolojik rekabetinden ayrılamaz. Amerikan yaptırımları, Huawei'nin en son teknoloji yarı iletken teknolojilerine erişimini sistematik olarak kısıtladı ve şirketi mevcut kısıtlamalar dahilinde performansı en üst düzeye çıkarmaya zorladı.

SemiAnalysis'ten yapılan sektör analizi, CloudMatrix 384'ün, yerleşik performans sınırlamalarını kabul eden ancak mimari avantajları vurgulayan Huawei'nin en son Ascend 910C yapay zeka işlemcisini kullandığını öne sürüyor: "Huawei bir nesil