
Odyssey'nin yapay zeka modeli videoyu etkileşimli dünyalara dönüştürüyor
Özet
Odyssey adlı yapay zeka laboratuvarı, videoyu interaktif dünyalara dönüştüren bir modelin önizlemesini yayınladı. Bu model, kullanıcının girdilerine gerçek zamanlı olarak yanıt veren, etkileşimli videolar oluşturuyor ve "Holodeck'in ilk versiyonu" olarak tanımlanıyor. Model, her 40 milisaniyede bir yeni kare üreterek, kullanıcının eylemlerine anında yanıt veren bir deneyim sunuyor. Geleneksel videolardan farklı olarak, bu model "dünya modeli" kullanarak, mevcut duruma ve kullanıcının eylemlerine göre gelecek kareleri tahmin ediyor. Bu teknoloji, özellikle film ve oyun prodüksiyonu için yeni bir eğlence ortamı potansiyeli taşıyor.
Londra merkezli yapay zeka laboratuvarı Odyssey, videoyu interaktif dünyalara dönüştüren bir modelin araştırma önizlemesini yayınladı. Başlangıçta film ve oyun prodüksiyonu için dünya modellerine odaklanan Odyssey ekibi, potansiyel olarak tamamen yeni bir eğlence ortamına denk geldi.
Odyssey'nin yapay zeka modeli tarafından oluşturulan interaktif video, girdilere gerçek zamanlı olarak yanıt veriyor. Klavyeniz, telefonunuz, kontrol cihazınız veya hatta sonunda sesli komutlarınızla etkileşimde bulunabilirsiniz. Odyssey'deki yetkililer bunu "Holodeck'in ilk versiyonu" olarak adlandırıyor.
Temeldeki yapay zeka, her 40 milisaniyede bir gerçekçi görünümlü video kareleri üretebiliyor. Bu, bir düğmeye bastığınızda veya bir hareket yaptığınızda, videonun neredeyse anında yanıt verdiği anlamına geliyor ve aslında bu dijital dünyayı etkilediğiniz yanılsamasını yaratıyor.
Odyssey'e göre, "Bugünkü deneyim, bozuk bir rüyayı keşfetmek gibi hissettiriyor—ham, dengesiz, ama inkar edilemez bir şekilde yeni." Burada cilalı, AAA kalitesinde oyun görsellerinden bahsetmiyoruz, en azından henüz değil.
Standart video teknolojisi değil
Biraz teknik konuşalım. Bu yapay zeka tarafından oluşturulan interaktif video teknolojisini, örneğin standart bir video oyunu veya CGI'dan farklı kılan nedir? Her şey Odyssey'nin "dünya modeli" dediği şeye dayanıyor.
Tüm klipleri tek seferde üreten geleneksel video modellerinden farklı olarak, dünya modelleri, mevcut duruma ve herhangi bir kullanıcı girdisine bağlı olarak neyin geleceğini tahmin etmek için kare kare çalışır. Büyük dil modellerinin bir dizideki bir sonraki kelimeyi tahmin etmesine benzer, ancak kelimeler yerine yüksek çözünürlüklü video karelerinden bahsettiğimiz için sonsuz derecede daha karmaşık.
Odyssey'nin ifadesiyle, "Bir dünya modeli, özünde, eyleme bağlı bir dinamik modeldir." Her etkileşiminizde, model mevcut durumu, eyleminizi ve olanların geçmişini alır, ardından buna göre bir sonraki video karesini oluşturur.
Sonuç, geleneksel bir oyundan daha organik ve öngörülemez hissettiren bir şey. "Bir oyuncu X yaparsa, Y olur" diyen önceden programlanmış bir mantık yok - bunun yerine, yapay zeka, sayısız video izleyerek öğrendiklerinden yola çıkarak bir sonraki ne olması gerektiğine dair en iyi tahminini yapıyor.
Odyssey, yapay zeka tarafından oluşturulan videoyla tarihi zorlukların üstesinden geliyor
Bunun gibi bir şey inşa etmek tam olarak parkta bir yürüyüş değil. Yapay zeka tarafından oluşturulan interaktif videoyla ilgili en büyük engellerden biri, zaman içinde istikrarı korumaktır. Her kareyi öncekilere dayalı olarak oluşturduğunuzda, küçük hatalar hızla birleşebilir (yapay zeka araştırmacılarının "sapma" olarak adlandırdığı bir olgu).
Bunun üstesinden gelmek için Odyssey, "dar dağıtım modeli" olarak adlandırdıkları bir şey kullandı - temel olarak yapay zekalarını genel video görüntüleri üzerinde önceden eğittiler, ardından daha küçük bir ortam kümesi üzerinde ince ayar yaptılar. Bu takas, daha az çeşitlilik anlamına gelir, ancak her şeyin tuhaf bir karmaşa haline gelmemesi için daha iyi bir istikrar sağlar.
Şirket, görünüşe göre "daha zengin bir piksel, dinamik ve eylem yelpazesi" sergileyen, yeni nesil modelleri üzerinde şimdiden "hızlı ilerleme" kaydettiklerini söylüyor.
Tüm bu fantezi yapay zeka teknolojisini gerçek zamanlı olarak çalıştırmak ucuz değil. Mevcut