Sızıntı, OpenAI'nin açık kaynaklı AI modelinin yayınlanmasının yakın olduğunu gösteriyor



Özet


Sızan bilgilere göre OpenAI, açık kaynaklı, potansiyel olarak birkaç saat içinde piyasaya sürülecek güçlü bir yapay zeka modeli üzerinde çalışıyor. Modelin, Uzmanların Karışımı (MoE) mimarisine dayalı 120 milyar parametreli bir versiyonu olduğu ve uzun metinleri işleyebildiği belirtiliyor. "gpt-oss" etiketi ve silinen model depoları, bu projenin OpenAI'nin açık kaynaklı yapay zeka alanına geri dönüşü olabileceğini işaret ediyor. Bu yeni model, Mistral AI'nin Mixtral'ı ve Meta'nın Llama ailesi gibi mevcut açık kaynaklı modellerle rekabet etmesi bekleniyor.




Bir sızıntı, OpenAI'nin potansiyel olarak birkaç saat içinde güçlü yeni bir açık kaynaklı yapay zeka modeli piyasaya süreceğini gösteriyor.

Kanıt, geliştiriciler tarafından hevesle incelenen bir dijital izden geliyor. Her şeyin merkezinde, yofo-deepcurrent/gpt-oss-120b ve yofo-wildflower/gpt-oss-20b gibi isimler taşıyan bir dizi model deposunu gösteren ekran görüntüleri yer alıyor. Depolar o zamandan beri silindi, ancak hesaplarda OpenAI ekip üyeleri yer alıyor.

'gpt-oss' etiketi, 'GPT Açık Kaynak Yazılımı' için açık bir işaret gibi görünen gerçek kanıt. Üst düzey modellerini giderek daha fazla koruyan bir şirket için bu, köklerine bir miktar geri dönüş olacaktır. Farklı kod adları ve boyutlara sahip birden fazla sürüm görmemiz, iyi planlanmış bir model ailesinin piyasaya çıkmak üzere olduğunu gösteriyor.

Sızdırılan bir yapılandırma dosyası sayesinde, şüpheli 120 milyar parametreli versiyonun motorunun altına bile bakabiliriz.

Model, Uzmanların Karışımı (MoE) mimarisi üzerine kurulmuş gibi görünüyor. Bunu, her şeyi bilmeye çalışan tek bir, monolitik beyinden daha çok, 128 uzmandan oluşan bir kurul gibi düşünün. Bir sorgu geldiğinde, sistem iş için en iyi dört uzmanı akıllıca seçer. Bu, modele devasa parametre sayısının engin bilgisini, ancak yalnızca bir kısmı aynı anda çalıştığı için çok daha küçük bir sistemin hızını ve çevikliğini verir.

Bu tasarım, OpenAI'nin açık kaynaklı yapay zeka modelini, Mistral AI'nin Mixtral'ı ve Meta'nın Llama ailesi gibi sahnenin gözdesi olanlarla doğrudan rekabete sokuyor.

Ve özellikler burada bitmiyor. OpenAI'nin açık kaynaklı yapay zeka modeli, daha geniş bir dil yelpazesinde daha verimli hale getirmesi gereken devasa bir kelime dağarcığına sahip gibi görünüyor ve uzun metin dizilerini zahmetsizce işlemek için Kayar Pencere Dikkatini kullanıyor. Uygulamada, bunların hepsi hem güçlü hem de çalıştırılması pratik bir modele işaret ediyor.

Peki, OpenAI neden şimdi böyle bir hamle yapsın? Yıllardır, şirket, daha açık başlangıçlarından uzaklaştığı için nazik dokundurmalara ve doğrudan eleştirilere maruz kaldı. Güçlü bir gpt-oss'yi piyasaya sürmek, geride kaldıklarını hisseden geliştiricilere ve araştırmacılara doğrudan yönelik devasa bir cazibe harekatı olacaktır.

Elbette, aynı zamanda akıllıca bir rekabet oyunu. Meta ve Mistral, gelişen bir açık kaynak ekosisteminin nasıl inovasyona yol açabileceğini gösterdi. Bunun gibi görünen güçlü bir açık kaynaklı yapay zeka modelini karışıma dahil ederek, OpenAI sadece yarışa katılmıyor; parkuru yeniden tanımlamaya çalışıyor.

OpenAI'den resmi haber alana kadar, teknik olarak hepsi hala bir söylenti. Ancak, kod ve yapılandırma dosyalarıyla desteklenen, içeriği olan bir söylenti.

Yapay zeka dünyasının en ünlü isminden yüksek performanslı, 120 milyar parametreli açık kaynaklı bir MoE modelinin lansmanı, bir dönüm noktası olmaktan başka bir şey olmayacaktır ve yakın gibi görünüyor.

(Fotoğraf: Mariia Shalabaieva)

Ayrıca bkz: Zuckerberg, Meta'nın 'kişisel süper zeka' vizyonunu özetliyor

Yapay zeka ve büyük veri hakkında daha fazlasını endüstri liderlerinden öğrenmek ister misiniz?