Open toolbar

لافتات Microsoft في معرض الصين الدولي الثالث للاستيراد (CIIE) في شنغهاي. 5 نوفمبر 2020 - REUTERS

شارك القصة
Resize text
القاهرة-

طوَّرت شركة "مايكروسوفت" نظاماً ذكياً لديه القدرة على إنشاء مقاطع بصوت أي إنسان، وذلك من خلال تدريب النظام على مقطع بصوت الشخص المستهدف، لا تزيد مدته عن  3 ثوانٍ فقط.

ويحمل النظام الجديد اسم "VALL-E" ويعمل على تحويل النصوص المكتوبة إلى مقاطع صوتية، وذلك بحسب صفحة المصدر الكودي للنظام على موقع GitHub.

ولا يقتصر النظام على إنشاء مقاطع صوتية عبر كتابة نصوص عشوائية، لكنه يستطيع أيضاً مراعاة أسلوب القراءة ونبرة الصوت، لإظهار شخصية صاحب الصوت الأصلي في المقاطع الصوتية المزيفة.

وبحسب الموقع، لا يزال النظام قيد التطوير والبحث، لكن المشروع يقدم مستوىً فائقاً في دقة محاكاة العوامل والمؤثرات الصوتية المحيطة بالمتحدث في المقطع الأصلي البالغة مدته 3 ثوان فقط، بحيث يتم إبرازها في المقاطع المصنعة بشكل أقرب للحقيقة.

وأوضحت عينات مقاطع صوتية عرضتها "مايكروسوفت" للكشف عن قدرات نظامها الجديد، مستوى دقيق للبرنامج في إنشاء مقاطع صوتية كأنها مسجلة خلال مكالمة هاتفية، وذلك من خلال اقتباس نمط الصوت ومستواه ودرجة شدته، من المقطع الأصلي المُسجل للمستخدم خلال حديثه في الحقيقة.

وأثبتت "مايكروسوفت" من خلال المقاطع الصوتية التي نشرتها على صفحة النظام الجديد على "جت هب" أن النظام بإمكانه إنشاء مقاطع صوتية بأساليب مختلفة، عبر استخدام صوت شخص واحد.

اقرأ أيضاً:

Google News تابعوا أخبار الشرق عبر Google News

نستخدم في موقعنا ملف تعريف الارتباط (كوكيز)، لعدة أسباب، منها تقديم ما يهمك من مواضيع، وكذلك تأمين سلامة الموقع والأمان فيه، منحكم تجربة قريبة على ما اعدتم عليه في مواقع التواصل الاجتماعي، وكذلك تحليل طريقة استخدام موقعنا من قبل المستخدمين والقراء.