Araştırmacılar Washington Üniversitesi harika bir fikir buldum için yapay zeka sistemi gürültü önleyici kulaklıklar.
Bu sistem, gürültülü bir ortamda, yalnızca kullanıcının o kişiye bakmasını sağlayarak tek bir kişinin sesini sıfırlayabilir ve güçlendirebilir. Yani kalabalıkta birini dinlemeye çalışıyorsanız bu kulaklıklar o kişinin sesine odaklanmanıza yardımcı olacaktır.
Hedef Konuşma İşitme Sistemi
Washington Üniversitesi araştırmacıları, kulaklık sesini kullanıcı tercihlerine göre ayarlayan yapay zeka destekli bir cihaz olan Hedef Konuşma İşitme (TSH) sistemini geliştirdi.
Bu çığır açan teknoloji, ACM CHI Bilgisayar Sistemlerinde İnsan Faktörleri Konferansı'nda görücüye çıktı, ancak henüz satın alınamadı. Ancak ekip, başkalarının keşfetmesi ve daha fazla geliştirmesi için kodu GitHub'da kullanıma sundu.
- "Anlamsal işitme" konusunda daha önceki çalışmalara dayanan TSH sistemi, kullanıcıların belirli seslere odaklanıp diğerlerini engellemesine olanak tanıyor.
- Şu anda sistem aynı anda yalnızca bir konuşmacıyı kaydedebilmektedir ve kayıt işlemi sırasında bu konuşmacının en yüksek sese sahip olmasını gerektirmektedir. Araştırmacılar şimdi bu teknolojiyi gelecekte kulaklıklara ve işitme cihazlarına genişletmeyi hedefliyor.
TSH Teknolojisi Nasıl Çalışır?
TSH sistemi, mikrofonlar ve yapay zeka sinir ağı ekleyerek normal kulaklıkları geliştirir. İşte nasıl çalışıyor:
- Belirli bir konuşmacının sesine kilitlenmek için kişiye üç ila beş saniye boyunca bakın ve kulaklıktaki bir düğmeye basın. Bu, kulaklıkların konuşmacının sesini yakaladığı "kayıt" aşamasını başlatır.
- Yapay zeka daha sonra, konuşmacının benzersiz ses özelliklerini tanımak için yakalanan bu sinyalleri gerçek zamanlı olarak analiz eder. Bu bilgi, konuşmacının sesini arka plandaki gürültüden sürekli olarak izole eden başka bir sinir ağına aktarılır.
Sistem kurulduktan sonra, konuşmacının sesine odaklanmayı sürdürebilir ve hareket etseniz veya başka tarafa baksanız bile konuşmacıyı net bir şekilde duyabilmenizi sağlar.
Kullanıcı Testi ve Geri Bildirimi
Washington Üniversitesi'ndeki araştırmacılar TSH sistemini 21 katılımcıyla teste tabi tuttu. Ortalama olarak bu kullanıcılar, hedeflenen konuşmacının sesinin netliğinin, filtrelenmemiş sese kıyasla neredeyse iki katına çıktığını buldu. Mevcut kurulum, kayıt sırasında hedef hoparlörün odadaki en yüksek sese sahip olmasını gerektirse de, kullanıcılar gerekirse ses kalitesini artırmak için yeniden kaydolabilirler.
Bu teknoloji, müzeler, şehir sokakları gibi çeşitli ortamlarda ve potansiyel olarak popüler kulaklıklardaki iletişimde devrim yaratabilir.
Gelecekteki Geliştirmeler ve Uygulamalar
TSH sistemi, kısmi işitme kaybı olan kişiler veya konuşmanın zor olduğu gürültülü ortamlarla sık sık uğraşan herkes için oyunun kurallarını değiştirebilir.
Araştırmacılar, sistemin aynı anda birden fazla konuşmacıyı kaydetmesine ve daha karmaşık ses ayarlarında sesleri izole etmesine izin vermek gibi mevcut sınırlamaların üstesinden gelebilecek gelecekteki güncellemeler konusunda umutlular.
Ayrıca bu teknolojiyi kulaklıklara ve işitme cihazlarına da uyarlamayı planlıyorlar, bu da onu çok daha fazla insan için daha erişilebilir ve kullanışlı hale getirecek.