شركة OpenAI: إطلاق نموذج Sora الجديد خلال 2024

فرق عمل للكشف عن "نقاط ضعف" نموذج إنتاج الفيديو عبر الذكاء الاصطناعي

time reading iconدقائق القراءة - 4
لقطة من إحدى مقاطع الفيديو المصممة بواسطة نموذج Sora الذكي لإنشاء الفيديوهات عبر الأوامر النصية - OpenAI
لقطة من إحدى مقاطع الفيديو المصممة بواسطة نموذج Sora الذكي لإنشاء الفيديوهات عبر الأوامر النصية - OpenAI
القاهرة -الشرق

قالت ميرا موراتي، مديرة التقنية بشركة OpenAI، إن الشركة مطورة ChatGPT ستطلق نموذجها Sora المتخصص في إنشاء الفيديوهات من الأوامر النصية إلى عموم المستخدمين بحلول نهاية العام الجاري.

وأشارت موراتي في حوار مع "وول ستريت جورنال"، إلى أن الشركة في الوقت الحالي تعمل بشكل مكثف على وضع المعايير واتخاذ الإجراءات الوقائية للتأكد من سلامة المحتوى المُنشأ عبر النموذج الجديد.

وأوضحت المديرة التقنية في OpenAI، أن "سورا" سيلتزم بنفس المعايير التي تعمل بها نماذج الشركة من عائلة DALL-E، المطورة لإنشاء الصور عبر الأوامر النصية، حيث لن يسمح النموذج المنتظر بإنشاء صور لشخصيات عامة أو محتوى سياسي.

ولكنها تابعت: "نحاول التعاون مع مختلف صناع المحتوى، لوضع قواعد تقدم تجربة آمنة، ولكن في الوقت نفسه تحافظ على الناحية الإبداعية".

"حركة اليد" أصعب التحديات

قبل الحوار مع الصحيفة الأميركية، أرسلت جوانا ستيرن، الكاتبة الصحفية المختصة بشؤون التقنية في "وول ستريت جورنال"، مجموعة من الأوامر النصية إلى OpenAI، ليتم إدخالها إلى "سورا"، وإنشاء مقاطع فيديو مصطنعة بالكامل، وجاءت النتائج غير خالية من العيوب.

أحد الفيديوهات المصممة عبر "سورا" كان لسيدتين في منتصف العمر، تجريان حواراً تلفزيونياً، وكان المقطع مثالياً من حيث تصميم الملابس وملامح الوجوه والشعر وكذلك البيئة العامة للمقطع، إلا أن حركات الأصابع واليدين مازالت غير دقيقة تماماً.

وأوضحت موراتي، بأنه "من الصعب للغاية عرض تمثيل متحرك لإيماءات اليد البشرية بشكل دقيق وواقعي".

ومن المقاطع المصورة أيضاً، جاء فيديو صممه نموذج Sora من أمر نصي يصف مشهد يعرض روبوت ينتزع الكاميرا من مصور بشري، إلا أن الفيديو المصمم عرض مشهداً مختلفاً لمصور بشري بالفعل ولكنه يتحول إلى روبوت، كذلك كانت هناك بعض التفاصيل غير الواقعية في الخلفية، مثل تحول سيارة أجرة صفراء إلى سيارة رمادية اللون.

وبررت المديرة التقنية في OpenAI ذلك، بأن النموذج الجديد، جيد في عرض تفاصيل بحركة رتيبة مستمرة، ولكنه لم يصل إلى حد "المثالية"، وبه بعض العيوب.

وأشارت موراتي أيضاً إلى أن المقاطع المنتجة عبر "سورا" في الوقت الحالي بلا صوت، إلا أنها وعدت بأن الشركة ستحل تلك المشكلة مستقبلًا.

وبشأن طبيعة البيانات التي تم تدريب "سورا" عليها، لم تقدم موراتي إجابة واضحة بشأن هذه المسألة، إلا أنها أكدت أنه من الممكن أن يكون التدريب اعتمد على أي فيديوهات منشورة بشكل عام ومتاحة عبر الإنترنت للاستخدام، وكذلك أي مقاطع فيديو حصلت OpenAI على ترخيص صناعها لاستخدامها.

نقاط الضعف

ركزت موراتي، على أن عملية الإعداد التي تعمل عليها الشركة في الوقت الحالي تركز بشكل رئيسي على التعاون مع فرق مختصة، في البحث عن نقاط الضعف بالنموذج، وهو ما يعرف بعملية Red Teaming، بحيث تتمكن الشركة من تزويد نموذجها بإجراءات السلامة اللازمة، التي تتجنب أي تحيزات أو نقاط ضعف أو إنتاج محتوى مخالف ومزعج.

وأردفت قائلة: "لهذه الأسباب لم نقم حتى الآن بإطلاق النموذج.. فنحن نحتاج إلى حل تلك المشاكل، كي نطلقه وكلنا ثقة من سلامته".

كذلك أوضحت، أن الشركة تعمل على تطوير النموذج لخفض استهلاكه من الطاقة والإمكانات اللازمة لتشغيله، مما يخفض تكاليف تشغيله، وبالتالي يصبح من الممكن طرحه تجارياً.

تصنيفات

قصص قد تهمك