يمكن لـ VALL-E من Microsoft نسخ أي صوت بشري في 3 ثوانٍ

عملاق التكنولوجيا مايكروسوفت كشف مؤخرا تكنولوجيا الذكاء الاصطناعي الجديدة (AI).

فال- إي

عين فال- إييقال أن نموذج الذكاء الاصطناعي هذا هو قادر على تحليل وتكرار أصوات الأشخاص من خلال الحاجة فقط إلى تسجيل صوت معين لمدة 3 ثوانٍ لتقليده. عندما تتم محاكاة صوت معين بنجاح، يستطيع VALL-E تغيير نغمة الصوت إلى النغمة العاطفية لذلك الشخص.

يوضح مبتكروه أنه تم تدريب VALL-E بـ 60,000 ألف ساعة من التحدث باللغة الإنجليزية من أكثر من 7,000 متحدث مختلف في محاولة لجعله ينتج خطابًا يبدو بشريًا.

انسخ أي صوت في 3 ثواني

وأوضح الباحثون الذين طوروا VALL-E أنه يمكن استخدام هذه التكنولوجيا في تطبيقات تحويل النص إلى كلام لإنتاج الأصوات بناءً على النصوص المعدة. لذلك، يحتاج مستخدمه فقط إلى إعداد نص يحتوي على ما يريد نقله دون الحاجة إلى تسجيل صوته يدويًا. يعتبر مفيدًا جدًا لأنشطة مثل تحرير الخطب وإنشاء محتوى صوتي.

يمكن أن يكون VALL-E خطيرًا

على الرغم من إمكانية الذكاء الاصطناعي قد يختلف الأمر، يشعر العديد من الأشخاص بالقلق بشأن التأثير السلبي الذي قد يحدثه VALL-E. يحمل VALL-E خطر إساءة الاستخدام التي قد تؤدي إلى تجريم مستخدميه، كما هو الحال في حالة استخدام التكنولوجيا لتزييف التعرف الصوتي أو انتحال صفة مكبرات صوت معينة.

على سبيل المثال، تم استخدام هذا الذكاء الاصطناعي لتزييف صوت شخص مشهور وهو يقول شيئًا لم يقله من قبل. تم العثور على هذا النوع من الحالات في عمليات التزييف العميق بتنسيق الفيديو.

بالإضافة إلى ذلك، فهو مشابه تقريبًا لـ عدسة AIوالذي تم اعتباره مؤخرًا انتهاكًا لأخلاقيات الفن لأنه يُخشى أن يحل محل الفنانين البشر من خلال صنع الفن الرقمي.

يستخدمه منتجو الموسيقى لنسخ أصوات المطربين

يثير VALL-E أيضًا أسئلة أخلاقية، مثل متى يتم استخدام الذكاء الاصطناعي من قبل شركات الإنتاج الموسيقي لغناء أغانٍ جديدة دون موافقة المغني الذي يمتلك الصوت.

وإدراكًا للمخاوف والمخاطر المحتملة التي قد يشكلها الروبوت، تقوم Microsoft، بصفتها المطور، بنشر إمكانات وأعمال نموذج الذكاء الاصطناعي فقط دون مشاركة الكود المصدري.

ويقول باحثو VALL-E إنهم سيحاولون بناء آلية قياس يمكنها منع مثل هذه المخاطر، مثل الطريقة التي يمكنها اكتشاف مقطع صوتي تم تصميمه بواسطة VALL-E أو الصوت الأصلي.


ما هو مايكروسوفت VALL-E؟

تم تصميم نموذج Microsoft VALL-E لفهم اللغة الطبيعية.

كيف يعمل مايكروسوفت VALL-E؟

من أجل فهم اللغة الطبيعية، يستخدم Microsoft VALL-E تقنيات التعلم العميق.

ما هي إمكانيات Microsoft VALL-E؟

باستخدام إدخال اللغة الطبيعية، يستطيع Microsoft VALL-E إكمال إدخالات النص والإجابة على الأسئلة والتحدث بشكل طبيعي.

ما هي تطبيقات مايكروسوفت VALL-E؟

بالإضافة إلى روبوتات الدردشة والواجهات القائمة على اللغة، يمكن أيضًا استخدام Microsoft VALL-E في تطبيقات خدمة العملاء.

هل Microsoft VALL-E مفتوح المصدر؟

T5 وGPT-3 هما نماذج لغات أخرى مفتوحة المصدر من Microsoft. ربما تغير توفر Microsoft VALL-E. يمكنك التصرف بها مباشرة أو التحقق من موقع Microsoft الرسمي.

الخروج من نسخة الهاتف المحمول