أعلنت شركة D-ID الناشئة عن إضافة لمسة ذكية من جانبها إلى النموذج اللغوي الضخم ChatGPT، حيث أضافت له الشركة وجهاً بشرياً وصوتاً، يجعل من المنصة مساعد ذكي يتخذ هيئة بشرية تتحدث للمستخدم وجها إلى وجه، لتكون أول منصة تصنع مساعد افتراضي بهيئة بشرية مع إمكانيات الذكاء الاصطناعي التوليدي Generative AI.
بحسب بيان رسمي، تضيف المنصة الجديدة Chat.D-ID نظام الشركة الذكي الخاص بتحويل النصوص لحركة وجوه مصورة إلى منصة "شات جي بي تي"، مما يجعل المستخدم قادراً على استخدام المنصة الذكية والتواصل معها بصورة أكثر طبيعية وأقرب إلى التواصل البشري المباشر.
وقال جيل بيري، مدير D-ID وأحد مؤسسيها، إن الخدمة الجديدة ستتيح إمكانية استفادة جمهور كبير من إمكانيات منصة ChatGPT، سواء على مستوى الأطفال أو كبار السن، بل وكذلك غير متعلمي القراءة والكتابة.
وأشار "بيري" إلى أن Chat.D-ID يسمح للمستخدمين بإمكانية اختيار طريقة الاستخدام، إما الكتابة النصية بلوحة المفاتيح أو الكتابة بالصوت.
ومن خلال تجربة "الشرق" للخدمة الجديدة، فإنه بمجرد بدء المحادثة مع الخدمة الجديدة، تبادر مساعدة شخصية ذكية تحمل اسم "أليس" بالتعريف عن نفسها، معبرة عن استعدادها للمساعدة والإجابة عن أي تساؤل.
"أليس" الرقمية يمكنها التحدث فقط باللغة الإنجليزية حتى الآن، وأشارت الشركة إلى أنها تعمل على جعل المستخدمين قادرين على تغيير هيئة المساعد الشخصي، سواء من خلال تصميم هيئة مساعدهم الخاص، أو الاختيار من الهيئات المعدة مسبقا من جانب الشركة.
وأوضحت الشركة أن المستخدم سيمكنه تصميم مساعده الخاص باستخدام أي صورة، إلا صور المشاهير والشخصيات العامة، وذلك منعاً لسوء استخدام الخدمة.
والخدمة مجانية بالكامل حتى الآن، إلا أن المدير التنفيذي للشركة قال، في حوار مع موقع "تيك كرانش" إن الخدمة قد يصبح جزء منها مدفوعاً في حال لاقت رواجاً كبيراً يتطلب من الشركة توسيع البنية التحتية التقنية التي يعتمد عليها تشغيلها.
وذاع صيت شركة D-ID في مطلع 2021 عندما قدمت بالتعاون مع منصة MyHeritage خدمة صناعة مقاطع فيديو من صور أفراد العائلة القديمة، مما أثار حينها ضجة كبرى.
ومن ثم تابعت الشركة تطوير تقنياتها حتى سبتمبر 2022 عندما قدمت خدمة أخرى تسمح بإنشاء مساعد ذكي عبر رفع صورة واحدة لوجه الشخص، مع تقديم مقطع صوتي للصوت المطلوب أن يكون صوت المساعد الذكي، ومن ثم يصبح بإمكان المستخدم كتابة أي نص كي يقرأه المساعد الذكي، مع الاختيار بين 119 لغة مختلفة وتقديم تعبيرات شعورية صوتية تتنوع بين الحزن والسعادة والغضب وغيرها.
اقرأ أيضاً: