OpenAI matematik olimpiyatlarında altın madalya kazandı



Özet


OpenAI, Uluslararası Matematik Olimpiyatı'nı modelleyen bir değerlendirmede altın seviyesinde performans gösterdiğini iddia etti. Bu, yapay zeka için uzun süredir devam eden bir hedef olup, geçerliliğine ilişkin eleştirileri beraberinde getirdi. Augment Code, profesyonel yazılımcılara karmaşık kod tabanlarında derinlemesine bağlam ve üretim kalitesinde özellikler sunuyor. ARC-AGI-3, yapay zeka ajanlarının görülmemiş ortamlarda genelleme yeteneğini test eden yeni bir kıyaslama aracı olup, erken sonuçlar yapay zekanın henüz insanları geçemediğini gösteriyor.




OpenAI'nin derecelendirmesiyle ilgili sorular devam ederken, Uluslararası Matematik Olimpiyatı'ndaki ilerleme, bir gün insanların henüz çözemediği problemleri çözebilecek türden matematiksel süper zekaya doğru atılan bir başka adımı gösteriyor.

Özet: OpenAI, "deneysel genel muhakeme LLM"sini insan yarışmasında kullanılan aynı problem ifadeleri üzerinde test ederek, 2025 Uluslararası Matematik Olimpiyatı'nı modelleyen bir değerlendirmede altın seviyesinde performans sergilediğini iddia etti.

Neden önemli: IMO'da altın madalya kazanmak, yapay zeka için uzun süredir devam eden bir hedef olduğu ve bir zamanlar neredeyse imkansız olduğu düşünüldüğü için, geçerliliğe ilişkin eleştiriler kaçınılmazdır. İlginç bir şekilde, bu hedefin henüz kamuya açık olmayan deneysel bir model tarafından başarılması, OpenAI'nin kesinlikle daha fazlasına sahip olduğu anlamına geliyor.

Özet: Augment Code'un güçlü yapay zeka kodlama aracı, profesyonel yazılım geliştiricilerle tam olarak bulundukları yerde buluşarak, en karmaşık kod tabanlarına bile üretim kalitesinde özellikler ve derin bağlam sağlıyor.

Özet: ARC Prize, yapay zeka ajanlarının görülmemiş ortamlarda genelleme yeteneğini test etmek için yeni bir etkileşimli muhakeme kıyaslama aracı olan ARC-AGI-3'ün bir önizlemesini yayınladı; erken sonuçlar, öncü yapay zekanın hala insanlara yaklaşamadığını, hatta onları geçemediğini gösteriyor.

Neden önemli: Yeni, yeniliğe odaklı etkileşimli kıyaslama aracı, özel beceri tabanlı testlerin ötesine geçiyor ve yapay zeka sistemlerinin, tıpkı biz insanlar gibi, yeni, görülmemiş ortamlara doğru ve doğru bir şekilde genelleme ve uyum sağlayabileceği gerçek yapay genel zekaya yönelik araştırmaları ilerletiyor.

Özet: Bu eğitimde, Grok 4 API'sini kullanarak yazma örneklerinizi analiz eden ve tam stilinize, tonunuza ve sesinize uyan yeni içerikler oluşturan kişiselleştirilmiş bir yapay zeka asistanı oluşturmayı öğreneceksiniz.

Profesyonel ipucu: Kopyalamak istediğiniz belirli stili en iyi şekilde artıran yazma örnekleri ekleyin ve diğer stiller için yeni asistanlar oluşturun (örneğin, tweet yazmak ve LinkedIn gönderileri yazmak gibi).

Özet: Yapay zekanın dönüştürücü gücüyle ilgili tüm konuşmalara rağmen, şirketler gerçekten somut bir getiri görüyor mu? 1.100'den fazla şirketin katılımıyla yapılan yeni bir Metrigy küresel araştırması, yapay zekaya yatırım yapan kuruluşların %90'ından fazlasının zaten olumlu bir YG elde ettiğini veya beklediğini doğruluyor.

Neden önemli: Bu bulgular, kritik bir zayıflığı ortaya koyuyor: Yapay zeka modelleri, insanları etkileyen aynı psikolojik taktikler kullanılarak manipüle edilebilir. Yapay zeka gelişimi katlanarak ilerlerken, yapay zeka laboratuvarlarının yapay zekanın davranışsal kalıplarını anlamak ve daha sağlam savunmalar geliştirmek için sosyal bilimcilerle işbirliği yapması çok önemlidir.

Meta'nın küresel ilişkiler başkanı, şirketin AB'nin Yapay Zeka Uygulama Kurallarını imzalamayacağını, bunun yasal belirsizlik yarattığını ve bloktaki yapay zeka mevzuatının kapsamının ötesine geçtiğini söyledi.

OpenAI CEO'su Sam Altman, şirketin bu yılın sonuna kadar 1 milyondan fazla GPU'yu çevrimiçi hale getirme yolunda olduğunu ve bir sonraki hedefin bunu "100 kat artırmak" olduğunu paylaştı.

The Rundown'ın yapay zeka profesörü Dr. Alvaro Cintas ile yaptığımız son canlı atölye çalışmasını izleyin ve tarama işleminizi otomatikleştirmek için Perplexity Comet'i (ve diğer alternatifleri) nasıl kullanacağınızı öğrenin.