Teknoloji devi Microsoft yakın zamanda açıklandı yepyeni yapay zeka (AI) teknolojisi.
İçindekiler
VADİ
adlı VADİ, bu AI modelinin olduğu söyleniyor Belirli bir sesin taklit edilmesi için yalnızca 3 saniyelik bir kayda ihtiyaç duyularak insanların seslerini analiz edip kopyalayabiliyoruz. Belirli bir ses başarılı bir şekilde simüle edildiğinde, VALL-E tonlamayı o kişinin duygusal tonuna göre değiştirebilir.
Yaratıcıları, VALL-E'nin, insana benzeyen bir konuşma üretmesi amacıyla 60,000'den fazla farklı konuşmacıdan 7,000 saat İngilizce konuşma eğitimi aldığını açıklıyor.
Herhangi bir sesi 3 saniyede kopyalayın
VALL-E'yi geliştiren araştırmacılar bu teknolojinin şu alanlarda kullanılabileceğini açıkladı: Hazırlanan transkriptlere dayalı olarak ses üretmek için metinden konuşmaya uygulamaları. Yani kullanıcısının, sesini manuel olarak kaydetmesine gerek kalmadan, iletmek istediği şeyi içeren bir senaryo hazırlaması yeterlidir. Konuşmaları düzenlemek ve ses içeriği oluşturmak gibi faaliyetler için oldukça faydalı olduğu düşünülmektedir.
VALL-E tehlikeli olabilir
potansiyeli olmasına rağmen yapay zeka değişebilir, birçok kişi VALL-E'nin ortaya çıkarabileceği olumsuz etkilerden endişe duymaktadır. VALL-E, teknolojinin sahte ses tanımlaması yapmak veya belirli konuşmacıların kimliğine bürünmek için kullanılması gibi, kullanıcılarını suçlu durumuna düşürebilecek kötüye kullanım riski taşır.
Örneğin bu yapay zeka, ünlü bir kişinin daha önce hiç söylemediği bir şeyi söyleyen sesini taklit etmek için kullanıldı. Bu tür vakalara video formatındaki deepfake'lerde rastlanmıştır.
Ayrıca hemen hemen aynı yapay zeka merceğiSon zamanlarda sanat etiğine aykırı olduğu düşünülen, dijital sanat yaparak insan sanatçıların yerini alabileceğinden korkuluyor.
Müzik yapımcıları bunu şarkıcıların seslerini kopyalamak için kullanıyor
VALL-E aynı zamanda ne zaman olacağı gibi etik soruları da gündeme getiriyor. Yapay zeka, müzik prodüksiyon şirketleri tarafından sesin sahibi olan şarkıcının izni olmadan yeni şarkılar söylemek için kullanılıyor.
Robotun oluşturabileceği endişelerin ve olası risklerin farkına varan geliştirici Microsoft, kaynak kodunu paylaşmadan yalnızca yapay zeka modelinin yeteneklerini ve işleyişini yayınlıyor.
VALL-E araştırmacıları, bu tür riskleri önleyebilecek bir ölçüm mekanizması oluşturmaya çalışacaklarını söylüyor. VALL-E tarafından tasarlanan bir ses klibini algılama veya orijinal ses.
Microsoft VALL-E nedir?
Microsoft VALL-E modeli doğal dili anlamak için tasarlanmıştır.
Microsoft VALL-E nasıl çalışır?
Microsoft VALL-E, doğal dili anlamak için derin öğrenme tekniklerini kullanır.
Microsoft VALL-E'nin yetenekleri nelerdir?
Microsoft VALL-E, doğal dil girişini kullanarak metin girişlerini tamamlayabilir, soruları yanıtlayabilir ve doğal bir şekilde sohbet edebilir.
Microsoft VALL-E'nin uygulamaları nelerdir?
Microsoft VALL-E, chatbot ve dil tabanlı arayüzlerin yanı sıra müşteri hizmetleri uygulamalarında da kullanılabiliyor.
Microsoft VALL-E açık kaynaklı mı?
T5 ve GPT-3 açık kaynaklı diğer Microsoft dil modelleridir. Microsoft VALL-E kullanılabilirliği değişmiş olabilir. Onları doğrudan hareket ettirirsiniz veya resmi Microsoft web sitesini kontrol edersiniz.