الذكاء الاصطناعي في مايكروسوفت.. أداة تحول صورة ومقطعاً صوتياً إلى "وجه ناطق"

شعار Microsoft في MWC (المؤتمر العالمي للجوال) في برشلونة. 2 مارس 2022 - AFP
شعار Microsoft في MWC (المؤتمر العالمي للجوال) في برشلونة. 2 مارس 2022 - AFP
سان فرانسيسكو (الولايات المتحدة)-أ ف ب

ابتكر باحثون من شركة "مايكروسوفت" أداة ذكاء اصطناعي قادرة على تحويل صورة وجه ومقطع صوتي إلى فيديو واقعي جداً لـ"وجه يتكلّم"، بحسب وثيقة نشرتها شركة التكنولوجيا الكبرى.

وأشارت الشركة إلى أن "هدف الأداة لا يتمثل في إنشاء محتوى بقصد التضليل أو الخداع"، لافتة إلى أنّ "الأداة، وعلى غرار تقنيات إنشاء محتوى أخرى، قد تُستخدم لأهداف مسيئة وانتحال صفة أيّ كان".

وأكّدت أن "بحثنا يركز على الصور الرمزية الافتراضية (أفاتار) بهدف الاستخدام الإيجابي"، مضيفة: "نعارض أي سلوك يهدف إلى إنشاء محتوى مضلل أو ضار".

"فاسا- 1"

ويلتقط البرنامج المسمى "فاسا-1" (VASA-1) صورة وجه بسيطة ويسجل مقطعاً صوتياً ويحولهما إلى شريط فيديو يظهر وجهاً يتحرك ويتكلم بطريقة واقعية جداً.

ولا تعتزم شركة التكنولوجيا، وهي مستثمر رئيسي في "أوبن إيه آي" مبتكرة برنامج Chat GPT، إتاحة الأداة الجديدة أو تقديم معلومات تقنية "طالما إننا غير متأكدين من أنّ الأداة ستُستخدم بشكل مسؤول بحسب القوانين المعمول بها".

وأشارت "مايكروسوفت" إلى أنّ فوائد ابتكار هذه الأداة "مثل تعزيز المساواة في مجال التعليم، ومساعدة مَن يعانون صعوبات في التواصل، وتوفير الدعم العلاجي لمَن يحتاجونه، تبرر العمل عليها".

وتعمل شركات أخرى على هذه التقنية، على غرار Runway، إحدى الشركات المتخصصة في الذكاء الاصطناعي التوليدي للفيديو، فيما أنشأ باحثون من "جوجل" برنامج ذكاء اصطناعي مسمى "فلوغر" قادر على إنشاء مقاطع فيديو واقعية لوجوه ناطقة.

ويثير النمو السريع للذكاء الاصطناعي التوليدي، الذي يتيح بسهولة إنتاج مختلف أنواع المحتوى بجودة عالية جداً، مخاوف كثيرة، خصوصاً في ما يتعلق بالاستغلال لأغراض الاحتيال والتضليل.

تصنيفات

قصص قد تهمك