• SoundHound yapay zekasına görme gücü veriyor SoundHound yapay zekasına görme gücü veriyor (artificialintelligence-news.com)
    by AI News            0 Yorum       



  • SoundHound, yapay zekasına görme gücü veriyor



    Özet


    SoundHound AI, Vision AI'ı piyasaya sürerek yapay zeka teknolojisini görüntü ve ses ile birleştiriyor. Bu yeni sistem, kullanıcıların cihazlarla daha doğal ve etkileşimli bir şekilde iletişim kurmasını sağlayarak, gerçek dünya uygulamalarında büyük fark yaratmayı hedefliyor. Vision AI, kameradan alınan canlı yayınları şirketin ses tanıma teknolojisiyle birleştirerek, kullanıcının niyetini daha iyi anlıyor. Bu sayede tamircilerden perakende çalışanlarına kadar birçok farklı alanda anında görsel ve işitsel rehberlik sunuyor.




    SoundHound AI, zaten sesli asistanlarda büyük bir oyuncu, teknolojisine bir çift göz veriyor.

    Bir dönüm noktasının yanından araba sürdüğünüzü ve telefonunuzu çıkarmadan, "Şu karşıdaki bina ne?" diye sorduğunuzu ve anında bir cevap aldığınızı hayal edin. SoundHound AI bunu inşa ediyor.

    Vision AI'ın piyasaya sürülmesiyle SoundHound'un yeni sistemi, teknolojiyle etkileşim kurmanın çok daha akıllı ve daha doğal bir yolu oluşturmak için görüntüyü sesle birleştiriyor. Amaç, biz insanların nasıl çalıştığını taklit etmek; sadece birini dinlemiyoruz, aynı zamanda jestlerini ve neye baktıklarını da görüyoruz.

    SoundHound, bu aynı bağlamsal anlayışı yapay zekaya getirerek, günümüzün birçok akıllı cihazıyla yaşadığımız hantal ve genellikle sinir bozucu deneyimi düzeltmeyi umuyor. Şirket, bu birleşik duygunun büyük bir fark yaratabileceği gerçek dünya uygulamalarını hedefliyor; bu ister bir sonraki arabanızda, ister restoranın arabaya servis bölümünde veya bir fabrika katında olsun.

    SoundHound AI CEO'su Keyvan Mohajer şunları söyledi: "SoundHound olarak, yapay zekanın geleceğinin sadece çok modlu olmadığına inanıyoruz; derinlemesine entegre, duyarlı ve gerçek dünya etkisi için inşa edilmiştir.

    Vision AI ile ses ve konuşma tabanlı yapay zekadaki liderliğimizi, insanların işletmeler tarafından sunulan ve kullanılan ürün ve hizmetlerle nasıl etkileşim kurduğunu yeniden tanımlamak için genişletiyoruz."

    Peki, nasıl çalışıyor? Vision AI, bir kameradan canlı bir yayın alır ve bunu, zaten doğal konuşmayı anlamada mükemmel olan şirketin ses teknolojisiyle birleştirir. Aynı anda gördüklerini ve duyduklarını işleyerek, sistem kullanıcının gerçek niyetini basit bir sesli asistanın asla yapamayacağı bir şekilde kavrayabilir.

    Aletlerini hiç bırakmadan anında görsel ve işitsel rehberlik alarak, bir motor parçasına bakıp talimat isteyen akıllı gözlük takan bir tamirci düşünün. Bir dükkanda, bir çalışan gerçek zamanlı bir envanter sayımı almak için sadece raflara bakarak tarama yapabilir. Geri kalanımız için, siparişimizi söylediğimiz anda ekranda görsel olarak doğrulayan bir arabaya servis kiosk'u anlamına gelebilir.

    Böyle bir sistem oluşturmadaki en büyük teknik problemlerden biri, ses ve görsel öğelerin mükemmel bir şekilde senkronize edilmesini sağlamaktır. Herhangi bir gecikme, doğal bir konuşma yanılsamasını bozacaktır.

    SoundHound AI'da Mühendislikten Sorumlu Başkan Yardımcısı Pranav Singh şunları söyledi: "Vision AI ile görsel tanımayı ve konuşma zekasını tek, senkronize bir akışta birleştiriyoruz. Her kare, her ifade, her niyet aynı ekosistem içinde yorumlanır; kiosk'lardan gömülü cihazlara kadar çeşitli yüzeylerde daha hızlı, daha doğal kullanıcı deneyimleri sağlanır.

    Bu, zeka ve yürütmenin kesişim noktasında bir yenilik olup, gördüklerinizi gören, söylediklerinizi duyan ve anında yanıt veren bir yapay zeka sunuyor."

    Bu teknolojiyi benimseyen işletmeler için vaat, daha hızlı hizmet, daha az hata ve daha mutlu müşteriler sunmaktır. Sürtünmeyi ortadan kaldırmak ve teknolojiyi, kullandırmanız gereken bir araçtan ziyade daha çok bir şey gibi hissettirmekle ilgilidir.