Rakip öğrenme atılımı, gerçek zamanlı yapay zeka güvenliğini mümkün kılıyor



Özet


Yapay zeka güvenliği için, düşmanca öğrenmeyi uygulamak statik savunmalara kıyasla önemli bir avantaj sağlar; bu, değişen yapay zeka destekli saldırılara karşı koymak için elzemdir. Ancak, düşmanca öğrenmeyi üretim ortamına dağıtmak, özellikle gecikme ve hesaplama maliyetleri nedeniyle zorluklar yaratır. Microsoft ve NVIDIA arasındaki işbirliği, donanım hızlandırma ve optimizasyonlar sayesinde bu darboğazı aşarak gerçek zamanlı düşmanca savunmayı kurumsal ölçekte uygulanabilir hale getirmiştir. Bu sayede, daha hızlı ve doğru bir şekilde tehditlere yanıt verilebilir.




Gerçek zamanlı yapay zeka güvenliği için düşmanca öğrenmeyi uygulayabilme yeteneği, statik savunma mekanizmalarına kıyasla belirleyici bir avantaj sunar.

Pekiştirmeli öğrenme (RL) ve Büyük Dil Modeli (LLM) yeteneklerini kullanan yapay zeka destekli saldırıların ortaya çıkışı, insan ekiplerinin yanıt verebileceğinden daha hızlı mutasyona uğrayan bir "vibe hacking" ve uyarlanabilir tehditler sınıfı oluşturdu. Bu, politika tek başına azaltamayacağı kurumsal liderler için bir yönetim ve operasyonel risk oluşturmaktadır.

Saldırganlar artık yerleşik savunmaları aşmak için çok adımlı akıl yürütme ve otomatik kod oluşturma kullanıyor. Sonuç olarak, endüstri "otonom savunmaya" (yani, insan müdahalesi olmadan akıllıca öğrenme, tahmin etme ve yanıt verme yeteneğine sahip sistemler) doğru gerekli bir geçiş gözlemliyor.

Ancak, bu gelişmiş savunma modellerine geçiş, tarihsel olarak zorlu bir operasyonel sınıra ulaştı: gecikme.

Tehdit ve savunma modellerinin birbirine karşı sürekli olarak eğitildiği düşmanca öğrenmeyi uygulamak, kötü niyetli yapay zeka güvenlik tehditlerine karşı koymak için bir yöntem sunar. Ancak, gerekli dönüştürücü tabanlı mimarileri canlı bir üretim ortamına dağıtmak bir darboğaz yaratır.

Microsoft NEXT.ai'de Baş Uygulamalı Araştırma Yöneticisi olan Abe Starosta şunları söyledi: "Düşmanca öğrenme, yalnızca gecikme, iş hacmi ve doğruluk birlikte hareket ettiğinde üretimde işe yarar."

Bu yoğun modelleri çalıştırmayla ilgili hesaplama maliyetleri daha önce liderleri yüksek doğrulukta tespit (yavaş olan) ve yüksek iş hacimli sezgisel yöntemler (daha az doğru olan) arasında seçim yapmaya zorluyordu.

Microsoft ve NVIDIA arasındaki mühendislik işbirliği, donanım hızlandırma ve çekirdek seviyesinde optimizasyonun bu engeli nasıl ortadan kaldırdığını ve gerçek zamanlı düşmanca savunmayı kurumsal ölçekte uygulanabilir hale getirdiğini gösteriyor.

Dönüştürücü modelleri canlı trafik için işletmeye almak, mühendislik ekiplerinin CPU tabanlı çıkarımın doğal sınırlamalarını hedeflemesini gerektiriyordu. Standart işlem birimleri, karmaşık sinir ağları ile yüklendiğinde üretim iş yüklerinin hacmini ve hızını yönetmekte zorlanır.

Araştırma ekipleri tarafından yürütülen temel testlerde, CPU tabanlı bir kurulum, yalnızca 0,81 istek/saniye iş hacmi ile 1239,67 ms'lik bir uçtan uca gecikme süresi sağladı. Bir finans kuruluşu veya küresel e-ticaret platformu için, her istekte bir saniyelik bir gecikme operasyonel olarak kabul edilemez.

GPU hızlandırmalı bir mimariye (özellikle NVIDIA H100 birimlerini kullanarak) geçiş yaparak, temel gecikme süresi 17,8 ms'ye düştü. Ancak, yalnızca donanım yükseltmeleri, gerçek zamanlı yapay zeka güvenliğinin katı gereksinimlerini karşılamak için yetersiz olduğunu kanıtladı.

Çıkarım motorunun ve belirteçleştirme işlemlerinin daha fazla optimizasyonuyla, ekipler 7,67 ms'lik nihai bir uçtan uca gecikme süresi elde etti; bu, CPU temel hattına kıyasla 160 kat performans hızlanmasıdır. Bu tür bir azalma, sistemi, satır içi trafik analizi için kabul edilebilir eşiklerin oldukça üzerine getirerek, düşmanca öğrenme kıyaslamalarında %95'in üzerinde doğrulukta tespit modellerinin dağıtılmasını sağlar.

Bir operasyonel