مقاطع الفيديو.. تجربة جديدة في تعليم الروبوتات

روبوتات لخدمة عملاء في مطعم افتتحته مجموعة من طلاب الجامعات في الموصل في العراق. 23 نوفمبر 2021. - Anadolu Agency

القاهرة- محمد منصور

تمكّن علماء من جامعة "كارنيجي ميلون" من تعليم "روبوتات" القيام بأعمال منزلية، وذلك من خلال عرض مقاطع فيديو لأشخاص يؤدون المهام اليومية في منازلهم، وذلك بحسب دراسة منشورة خلال فعاليات مؤتمر الرؤية الحاسوبية المنعقد في مدينة "فانكوفر" الكندية.

ونجح "روبوتان" في تعلم 12 مهمة، بما في ذلك فتح الدرج وباب الفرن والغطاء، فضلاً عن أخذ وعاء من الموقد، والتقاط الهاتف أو الخضار أو إناء الحساء.

ويقول العلماء إن "الروبوت" يُمكنه تعلم أين وكيف يتفاعل البشر مع أشياء مختلفة، من خلال مشاهدة مقاطع الفيديو. ومن خلال هذه المعرفة، يمكن تدريب نموذج يمكن "روبوتين" من إكمال مهام مماثلة في بيئات متنوعة".

ويمكن أن تساعد الطريقة الجديدة لتعليم "الروبوتات" في تحسين فائدتها في المنزل، ما يسمح لهم بمساعدة الأشخاص في مهام مثل الطهي والتنظيف.

وتتطلب الأساليب الحالية لتدريب الروبوتات إما عرضاً يدوياً للمهام من قبل البشر، أو تدريباً مكثفاً في بيئة محاكاة، في حين يقول العلماء إن كلا الطريقتين "مضيعة للوقت" وعرضة للفشل، لكن التجربة الجديدة في التعلم مختلفة.

تقليد البشر

وأظهرت الأبحاث السابقة لديباك باثاك وهو أستاذ مساعد في معهد علوم الروبوتات في كلية علوم الكومبيوتر بجامعة "كارنيجي ميلون" وفريقه، أن الروبوتات قادرة على التعلم من خلال مراقبة البشر أثناء تأديتهم للمهام المعقدة.

ولكن الأبحاث السابقة والتي تثبت تعلم الروبوتات من الإنسان في البيئة الطبيعية، تتطلب أن يقوم الإنسان والروبوت بنفس المهام في نفس البيئة.

أما بحث باثاك وفريقه الجديد، فإنه يستبعد ضرورة أن يقوم الإنسان بتنفيذ المهمة، أو أن يقوم الروبوت بتقليده في نفس البيئة والظروف.

وعن طريق تحليل البيانات المرئية التي تم التقاطها في مقاطع الفيديو، يستطيع "الروبوت" معرفة العلاقات المكانية بين البشر والأشياء، والإيماءات أو الحركات المحددة التي يستخدمها البشر أثناء التفاعل، وتسلسل الإجراءات التي يتم تنفيذها.

وتتضمن هذه العملية تقنيات تعرف الكمبيوتر على الأشياء وتتبعها، واكتشاف الأوضاع والإيماءات البشرية، وفهم ديناميات تفاعلات الكائن البشري.

ومن خلال عملية التعلم هذه يمكن للروبوت اكتساب المعرفة حول الأنماط والاستراتيجيات التي يستخدمها البشر عند التفاعل مع الأشياء، كما يمكنه بعد ذلك تعميم هذه المعلومات المكتسبة لأداء مهام أو تفاعلات مماثلة في بيئتها الخاصة.

"جسر الرؤية"

وطور الباحثون تقنية تسمى "جسر الرؤية للروبوتات" تربط أو تدمج رؤية الكمبيوتر مع "الروبوتات" لتعزيز إدراكها وقدراتها.

وتتضمن رؤية الكمبيوتر استخراج وتحليل وفهم المعلومات المرئية من الصور أو بيانات الفيديو، بحيث تمكن الآلات، بما في ذلك "الروبوتات"، من إدراك وتفسير العالم المرئي.

وتستطيع خوارزميات رؤية الكمبيوتر معالجة الصور أو تدفقات الفيديو لاكتشاف الكائنات، والتعرف على الأنماط، وتتبع الحركة، وتقدير العمق، واستخراج الميزات المرئية الأخرى ذات الصلة.

وباستخدام تلك التقنية، يمكّن للروبوتات اتخاذ قرارات مستنيرة، والتنقل في بيئات معقدة، والتفاعل مع الكائنات والبشر، وأداء المهام بكفاءة ودقة أكبر.

ويقول الباحثون إن التقنية تسهل العديد من التطبيقات، مثل التنقل المستقل والتعرف على الكائنات ومعالجتها والتفاعل بين الإنسان و"الروبوت" والواقع المعزز والافتراضي، فضلاً عن تفسير الإشارات المرئية بشكل أفضل، والتكيف مع البيئات الديناميكية وغير المنظمة، مما يعزز وظائفها العامة.

تعلم خلال 25 دقيقة

وأظهر البحث الجديد أن الروبوتات بحاجة إلى التدرب على القيام بالمهام المعقدة، ولكن يمكنها تعلم المهمة الجديدة في أقل من 25 دقيقة.

ويقول الباحثون إنهم تمكنوا من اصطحاب "الروبوتات" في جميع أنحاء الحرم الجامعي، والقيام بجميع أنواع المهام.

كما يقولون أيضاً إنه يمكن للروبوتات استخدام هذا النموذج لاستكشاف العالم من حولهم "بفضول"، وأن يكونوا أكثر مباشرة في كيفية التفاعل معه.

واستخدم الفريق ما يقرب من 4000 ساعة من مقاطع فيديو لأنشطة يومية من جميع أنحاء العالم، لتعليم "الروبوتات" مهام مثل الطهي والتنظيف ومهام المطبخ الأخرى.

ويمكن للروبوت من خلال التعلم من مقاطع الفيديو، أن يكيّف سلوكه مع المواقف والبيئات المختلفة. كما يمكنه ملاحظة كيفية تفاعل البشر مع الكائنات في سياقات مختلفة وتعميم تلك المعرفة لأداء مهام مماثلة في سيناريوهات جديدة وغير مرئية.

وتسمح هذه القدرة للإنسان الآلي على التكيف بالتعامل مع نطاق أوسع من المهام ويكون أكثر مرونة في تفاعلاته.

وبدلاً من برمجة كل جانب من جوانب سلوك "الروبوت" بشكل صريح، يتيح له التعلم من مقاطع الفيديو، اكتساب مهارات وسلوكيات من خلال الملاحظة، ما يقلل الحاجة إلى البرمجة اليدوية، ويمكّن الروبوت من التعلم بشكل مستقل وتحسين قدراته، مما يجعل دمجه في تطبيقات مختلفة أسهل وأكثر كفاءة.

مصادر غنية

وتوفر مقاطع الفيديو مصدراً غنياً للمعلومات ليتعلم الروبوت منها، حيث يمكنه الاستفادة من المعرفة والخبرة الجماعية التي تم التقاطها في مقاطع الفيديو.

ومن خلال تقليد تصرفات وسلوكيات الإنسان المكتسبة من مقاطع الفيديو، يستطيع "الروبوت" أن يصنع تجربة تفاعل أكثر طبيعية وبديهية للبشر، وهو أمر مهم بشكل خاص في مجالات مثل "الروبوتات الاجتماعية"، وتلك الخاصة بالرعاية الصحية، و"روبوتات المساعدة"، حيث يكون التفاعل السلس بين الإنسان و"الروبوت" مطلوباً.

اقرأ أيضاً:

تصنيفات

الذكاء الاصطناعي