
Huawei AI çipi arızalanınca DeepSeek, R2 modeli için Nvidia'ya geri dönüyor
Özet
DeepSeek'in yeni yapay zeka modeli R2'yi Huawei'nin Ascend çiplerinde eğitme girişimi, teknik sorunlar nedeniyle başarısız oldu ve Nvidia'ya geri dönmek zorunda kalındı. Bu durum, modelin lansmanını geciktirerek, Çin'in yerel çip kullanma hedeflerine ters düştü. Eğitim sürecinin zorluğu, Huawei çiplerinin henüz bu kapasiteye ulaşamaması nedeniyle ortaya çıktı. Şirket, R2'yi daha az talepkar çıkarım aşaması için hala Huawei çiplerinde çalıştırmaya çalışıyor.
DeepSeek'in yeni yapay zeka modeli R2'yi Huawei'nin Ascend çipleri üzerinde eğitme planı başarısız oldu ve Nvidia'ya geri dönmek zorunda kalındı, bu da lansmanı geciktirdi.
Aylar boyunca Pekin tarafından itilen anlatı, durdurulamaz teknolojik ilerleme ve kendi kendine yeterliliğe doğru bir yürüyüş oldu. Ancak gerçekliğin geri tepme gibi bir huyu vardır. Çin'in yapay zeka gözdesi DeepSeek'in son sıkıntıları, hırsın teknik sınırlamaların sert duvarıyla karşılaştığı yerin ders kitabı niteliğinde bir örneğidir.
Ocak ayında R1 modelini başarılı bir şekilde piyasaya sürdükten sonra DeepSeek, Çin'den gelen ulusal davayı destekleme baskısı altında kaldı. Financial Times'a konuşan üç kişiye göre, mesaj açıktı: Nvidia yerine Huawei'nin çiplerini kullanın.
Yeni R2 modelini eğitme zamanı geldiğinde, kaynaklar DeepSeek'in Huawei'nin yapay zeka çiplerinde "kalıcı teknik sorunlarla" karşılaştığını söylüyor. Sorunlar o kadar temeldi ki proje durma noktasına geldi. Duruma yakın bir kişi, modelin Mayıs ayında planlanan lansmanının iptal edilmesinin ana nedeninin bu olduğunu ve şirketi kimsenin beklemediği bir pazarda dezavantajlı duruma düşürdüğünü söyledi.
Bunun neden bu kadar büyük bir sorun olduğunu anlamak için yapay zeka eğitimi ve çıkarımı arasındaki farkı bilmeniz gerekir. Eğitim, tıpkı bir öğrenciyi yıllarca yoğun öğrenim için üniversiteye göndermek gibidir, zor kısımdır. Muazzam miktarda güç ve istikrar gerektirir. Çıkarım, tıpkı mezuna bir soru sormak gibi, nispeten 'kolay' kısımdır.
DeepSeek, Huawei'nin çiplerinin son sınav için hazır olabileceğini ancak henüz zorlu üniversite kursuna hazır olmadığını keşfetti. Şirketin eğitim yapmak için Nvidia'nın güçlü sistemlerine geri dönmekten başka çaresi kalmadı. Kaynaklar, DeepSeek ekibinin hala R2 modelini daha az talepkar çıkarım aşaması için Huawei çiplerinde çalıştırmaya çalıştığını söylüyor.
İki kişi, Huawei'nin R2 modelini çiplerinde çalışır duruma getirmelerine yardımcı olmak için kendi mühendis ekibini bile DeepSeek'in ofislerine gönderdiğini doğruladı. Ancak uzmanlar odadayken bile başarılı bir eğitim turu gerçekleştiremediler.
Endüstrideki herhangi biriyle konuşun ve bunun büyük bir sürpriz olmadığını söyleyeceklerdir. Huawei CEO'su Ren Zhengfei bile bu yılın başlarında ABD'nin "Huawei'nin başarılarını abarttığını" ve şirketin "henüz o kadar harika olmadığını" söyleyerek en iyi çiplerinin hala bir nesil geride olduğunu belirtti.
Ancak Pekin, şirketlerin artık Nvidia'nın ihracata uygun H20 çipinin siparişlerini gerekçelendirmesi gerektiği Financial Times'ın bildirmesiyle, yerel donanımı desteklemek için hala teknoloji devlerini aktif olarak zorluyor. Bu, yerel bir şampiyon inşa etme stratejisinin bir parçası, ancak şirketleri teknik olarak daha düşük seçimler yapmaya zorlayabilir.
Huawei'nin çiplerini eğitim için kullanma konusunda karşılaşılan sorunların yanı sıra, DeepSeek'in kurucusu Liang Wenfeng'in ekibine R2 modeline yönelik genel ilerlemeden memnun olmadığını söylediği bildiriliyor. Onları daha yükseğe hedeflemeye ve şirketi yapay zeka endüstrisi liderleri arasında tutabilecek bir şeyler inşa etmeye zorladığı söyleniyor.
Tüm yukarıdan aşağıya yönlendirmeler için