
JBS Dev: Eksik veriler ve yapay zekanın son aşaması üzerine – model yeteneğinden maliyet sürdürülebilirliğine
Özet
Üretken yapay zeka sistemlerini uygulamak için kusursuz veri setlerine sahip olmanın şart olduğu inancı, günümüzde geçerliliğini yitiren yaygın bir yanlış kanıdır. Modern yapay zeka araçları, hatalı veya düzensiz verileri işleme konusunda oldukça yetenekli olup, süreçteki karmaşayı yönetebilecek seviyeye ulaşmıştır. Sistemin öngörülemezliğini dengelemek için "döngüdeki insan" yaklaşımı kritik bir rol oynarken, teknoloji sayesinde düzensiz belgelerden dahi anlamlı ve temiz veriler elde edilebilmektedir. Özetle, verilerin mükemmel olmasını beklemeden doğru güvenlik önlemleriyle harekete geçmek, işletmeler için önemli bir stratejik avantaj sağlamaktadır.
Stratejik teknoloji sağlayıcısı JBS Dev'in başkanı Joe Rose, üretken ve aracılı yapay zeka sistemleriyle çalışma konusundaki efsanelerden birini çürütmek istiyor. Rose, "Bu tür iş yüklerinden herhangi birini yapmadan önce verilerinizin mükemmel olması gerektiği yaygın bir yanlış kanıdır" diye açıklıyor.
AI Fieldbook'taki yakın tarihli bir makalede belirtildiği gibi, satıcılar ve danışmanlar -şaşırtıcı olmayan bir şekilde- sırasıyla devasa veri göllerine ve çok yıllık veri dönüşüm programlarına ihtiyacınız olduğunu öne sürüyor. Bu nedenle yöneticiler tüm bunlar karşısında ne yapacaklarını şaşırmış durumdalar. Gerçek ise biraz farklı. Rose, "Kötü kaliteli verilerle başa çıkmak için araçlar hiç bu kadar iyi olmamıştı" diyor ve ekliyor: "Bir LLM'in (Büyük Dil Modeli) yarım yamalak yazılmış bir istemden (prompt) neler anlayabildiği gerçekten şaşırtıcı."
Bu mantıklı. Eğer elinizde böyle bir araç varsa, doğru güvenlik önlemlerini alarak bunu kendi avantajınıza kullanmaya değer. Modellerin doğasında var olan öngörülemezlik, hatalı çıktıları ele alma ihtiyacını beraberinde getiriyor; işte bu noktada "döngüdeki insan" (human in the loop) devreye giriyor. Metinsel veya kategorik veriler için bir dayanıklılık söz konusu. Rose, "İnsanlar 'biz yaparız, çalışır, sonra da unuturuz' mantığına alışkın," diyor. "Ancak bu sistemler böyle çalışmıyor."
Kusurlu veriler konusunda Rose, tıp sektöründe başka bir faturalandırma mutabakat sistemine geçişi hedefleyen bir müşteri örneği veriyor. Kayıtlar karışıktı; bazıları PDF, bazıları resim formatındaydı; prosedür bazen doktorun adıyla, doktorun adı hastanın adıyla yazılmıştı ve benzeri hatalar vardı. Üretken yapay zeka, OCR ile görüntülerden PDF'ler için metin çıkarmaya kadar basit bir istemden temiz verileri kapsamına alabildi; ardından, müşteri kaydını bir sigorta sözleşmesiyle karşılaştırarak doğru oranda faturalandırılıp faturalandırılmadıklarını kontrol etmek gibi daha aracılı yaklaşımlardan yararlanıldı.
Rose, "Farklı kullanım durumlarını üst üste bindirmeye başlarsınız," diyor. "Bu, her şeyi doğru yaptığı anlamına gelmiyor; yine de döngüde bir insana ihtiyacınız var. Ancak yapmak istediğiniz şey, 'yüzde 20 otomasyonla başladık, sonra yüzde 40, 60 ve 80'e çıktık' diyerek bunu zamanla büyütmektir."
İleriye bakıldığında Rose, bu modeller için gelecekteki tartışmaların maliyet ve taşınabilirlik etrafında şekillenmesini bekliyor. "Model yeteneklerindeki radikal sıçramalardan ziyade, 'veri merkezlerini şu an inşa ettiğimiz hızda inşa etmek zorunda kalmamak için maliyeti nasıl daha sürdürülebilir hale getiririz?' konusuna doğru bir kayma göreceğimizi düşünüyorum" diyor.
"Son aşama, 'bu şeyleri bir veri merkezinde çalıştırmak zorunda kalmadan bir dizüstü bilgisayarda veya telefonda nasıl çalıştırırız?' sorusudur. Modeller bir veri kümesi üzerinde, yani esasen internetteki her sayfa ve diğer içerikler üzerinde eğitildi. Zaten içlerine konulmamış ve bir tür çığır açacak devasa miktarda başka bir veri yok."
JBS Dev'in katıldığı AI & Big Data Expo'da Rose, yapılacak görüşmeleri dört gözle bekliyor ve dile getireceği bir başka tartışmalı görüşü de insanlara, kendiniz yapabileceğiniz durumlarda SaaS satıcılarından satın almayı bırakmalarını söylemek olacak.