مالكة "تيك توك" تطلق نموذجاً ذكياً لإنشاء فيديوهات واقعية من الصور

شعار شركة 'بايت دانس' في جناحها خلال جولة إعلامية في العاصمة الصينية بكين. 10 فبراير 2022 - REUTERS
شعار شركة 'بايت دانس' في جناحها خلال جولة إعلامية في العاصمة الصينية بكين. 10 فبراير 2022 - REUTERS
القاهرة -الشرق

كشفت شركة "بايت دانس"، مالكة تطبيق "تيك توك"، عن نموذج ذكاء اصطناعي أطلقت عليه اسم OmniHuman، قادر على تحويل الصور إلى مقاطع فيديو واقعية تُظهر الأشخاص وهم يتحدثون ويغنون ويتحركون بشكل طبيعي، في خطوة يُتوقع أن تُحدث تغييراً جذرياً في مجالات الترفيه والاتصالات الرقمية.

ويمثل OmniHuman  قفزة كبيرة في مجال الذكاء الاصطناعي، إذ يمكنه إنشاء مقاطع فيديو كاملة تُظهر الأشخاص بحركات جسدية متناسقة مع حديثهم، متجاوزاً بذلك النماذج السابقة التي كانت تقتصر على تحريك ملامح الوجه أو الجزء العلوي من الجسد، بحسب بيان عن النموذج على موقع GitHub.

ودربت الشركة الصينية نموذجها الجديد باستخدام أكثر من 18 ألفاً و 700 ساعة من مقاطع الفيديو البشرية، وفقاً لدراسة نُشرت على منصة arXiv.

وقال باحثون في الشركة، إن الطرق التقليدية في إنشاء مقاطع الفيديو عبر الذكاء الاصطناعي كانت تواجه صعوبة في التوسع إلى نماذج أكثر تعقيداً بسبب قيود البيانات، ما كان يُحدّ من إمكانياتها في التطبيقات العملية.

وتعتمد تقنية OmniHuman على نهج جديد يُسمى "التدريب متعدد الظروف Omni-Conditions" والذي يسمح للنموذج بالتعلم من مصادر مختلفة، تشمل النصوص، والصوت، وحركات الجسد، ما يُمكّن الذكاء الاصطناعي من استيعاب بيانات أكثر تنوعاً مقارنة بالأساليب السابقة.

وقال الفريق البحثي إن إدراج إشارات متعددة أثناء عملية التدريب، مثل النص والصوت ووضعية الجسم "يقلل بشكل كبير من إهدار البيانات".

 وأظهرت الاختبارات، أن تفوق النموذج الجديد على النماذج السابقة من حيث جودة الحركة والتناسق مع الكلام.

ومن المقرر أن يقدم الباحثون نتائجهم في مؤتمر علمي متخصص في الرؤية الحاسوبية، خلال الفترة المقبلة، إلا أنهم لم يعلنوا بعد عن موعد المؤتمر أو تفاصيله.

يأتي هذا التطور وسط سباق متزايد بين عمالقة التكنولوجيا مثل ميتا وجوجل ومايكروسوفت، والتي تسعى إلى تطوير أنظمة ذكاء اصطناعي متقدمة لإنشاء مقاطع فيديو واقعية.

ومن المتوقع أن يمنح هذا الابتكار الجديد، شركة "بايت دانس"، ميزة تنافسية في هذا المجال المتسارع.

ولكن على الرغم من الفوائد الهائلة لهذه التقنية، إلا أن الخبراء يحذرون من احتمال إساءة استخدامها في إنشاء محتوى مزيف أو مضلل، مثل مقاطع الفيديو عميقة التزييف التي ربما تُستغل في نشر المعلومات المضللة أو انتهاك الخصوصية.

تصنيفات

قصص قد تهمك