طور باحثون من جامعة ليدز البريطانية، وكلية لندن الجامعية، نظاماً يعتمد على الذكاء الاصطناعي يمكّن الروبوتات رباعية الأرجل من التكيف مع التضاريس المختلفة وغير المألوفة عند المشي، مثلما تفعل الحيوانات الحقيقية، وهو ما يمثل خطوة نحو استخدام الروبوتات ذات الأرجل في البيئات الخطرة التي قد تُعرض البشر للخطر.
وتساعد هذه التكنولوجيا، الروبوت على تغيير طريقة حركته بشكل مستقل تمامًا، دون حاجة إلى توجيه مسبق بموعد أو كيفية تغيير خطواته، إذ أنه يتعلم من اخطائه، على عكس الجيل الحالي من الروبوتات.
وتُعد هذه القدرة على التكيف إنجازاً محورياً يُمكن أن يفتح آفاقًا جديدة لاستخدام الروبوتات في مهام حرجة، مثل تفكيك المنشآت النووية، أو عمليات البحث والإنقاذ في الكوارث، خاصة أن عدم القدرة على التكيف مع المجهول ربما يؤدي لوقوع خسائر في الأرواح.
واستلهم الباحثون في دراستهم، التي نشرتها دورية "نيتشر ماشين أنتليجنس" ما يحدث في مملكة الحيوان، لتعليم الروبوت كيفية التنقل في تضاريس لم يسبق له رؤيتها.
وشملت التجارب حيوانات رباعية الأرجل مثل الكلاب، والقطط، والخيول، المعروفة بقدرتها الفائقة على التكيف مع التضاريس الطبيعية المتنوعة.
وتُغير هذه الحيوانات طريقة حركتها بهدف توفير الطاقة، أو الحفاظ على التوازن، أو الاستجابة السريعة للتهديدات.
روبوت يهرول ويركض ويقفز
ونجح الباحثون في إنشاء نظام يُمكنه تعليم الروبوتات كيفية الانتقال بسلاسة بين أنواع مختلفة من المشي، مثل الهرولة، والركض، والوثب، تمامًا كما تفعل الثدييات في الطبيعة.
ومن خلال تضمين نفس الاستراتيجيات التي تستخدمها الحيوانات للتنقل في عالم لا يمكن التنبؤ به ضمن نظام الذكاء الاصطناعي، يتعلم الروبوت، الذي أُطلق عليه اسم "كلارنس"، التبديل بسرعة بين أنواع المشي أثناء الحركة، استجابةً للتضاريس المتغيرة.
وبفضل قدرة الذكاء الاصطناعي الهائلة على معالجة البيانات، تعلم الروبوت الاستراتيجيات اللازمة في 9 ساعات فقط، وهو زمن أسرع بكثير من الأيام أو الأسابيع التي تستغرقها معظم صغار الحيوانات لتجاوز الأسطح المختلفة بثقة.
وأشار المؤلف الأول للورقة البحثية، جوزيف همفريز، الباحث في مرحلة ما بعد الدكتوراه بكلية الهندسة الميكانيكية في جامعة ليدز، إلى أن إطار العمل يمكّن الروبوت من تغيير خطواته وفقًا لبيئته، متغلبًا على مجموعة متنوعة من التضاريس مثل الأخشاب غير المستوية، ورقائق الخشب المتناثرة، والنباتات الضخمة، دون أي تعديلات على النظام نفسه.
وقال همفريز: "نتائجنا يمكن أن يكون لها تأثير كبير على مستقبل التحكم في حركة الروبوتات ذات الأرجل من خلال تقليل العديد من القيود السابقة المتعلقة بالقدرة على التكيف".
وأضاف: "هذا الإطار للتعلم المعزز العميق يُعلّم استراتيجيات وسلوكيات مستوحاة من الحيوانات الحقيقية - أو مستوحاة بيولوجيًا - مثل توفير الطاقة، وتعديل الحركات حسب الحاجة، وذاكرة المشية، لتحقيق حركة عالية التكيف والأمثل، حتى في بيئات لم تُصادفها من قبل".
وقال الباحثون إن كل التدريب يحدث في المحاكاة، إذ تُدرب السياسة على الكمبيوتر، ثم تُنقل وتُوضع على الروبوت، وتكون بنفس الكفاءة كما في التدريب، موضحين أن الأمر يُشبه فيلم "ماتريكس" في إشارة إلى مهارة جديدة في الفنون القتالية إلى دماغ البطل، لكنه لا يخضع لأي تدريب بدني في العالم الحقيقي.
تعليم الروبوت "الذكاء الغريزي"
واختبر الباحثون الروبوت بعد ذلك في العالم الحقيقي، على أسطح لم يُصادفها من قبل، ونجح في التنقل عبرها جميعًا.
وغالبًا ما تكون أنظمة التعلم المعزز العميق جيدة في تعلم مهمة محددة، ولكنها تُعاني من صعوبة التكيف عندما تتغير البيئة.
وتتمتع أدمغة الحيوانات بهياكل مدمجة ومعلومات تدعم التعلم، بينما يمكن لبعض الأنظمة الاصطناعية محاكاة هذا النوع من التعلم، فإن أنظمتها عادة ما تكون أقل تقدمًا أو تعقيدًا.
وأشار الباحثون إلى أنهم تغلبوا على هذا التحدي من خلال غرس استراتيجيات الحركة الطبيعية للحيوانات في نظامهم، مؤكدين أن إطار عملهم هو الأول الذي يدمج في آن واحد المكونات الثلاثة الحاسمة للحركة الحيوانية في نظام تعلم معزز، والتي تشمل استراتيجيات الانتقال بين أنواع المشي، والذاكرة الإجرائية للمشية، والتعديل التكيفي للحركة.
ويقول الباحثون إن هذا التكامل يُمكّن من النشر الفعلي متعدد الاستخدامات في العالم الحقيقي مباشرة من المحاكاة، دون الحاجة إلى تعديل إضافي على الروبوت الفعلي، فالروبوت لا يتعلم فقط كيف يتحرك، بل يتعلم كيف يقرر أي نوع من المشي يستخدم، ومتى يُغيره، وكيف يُعدله في الوقت الفعلي، حتى على تضاريس لم يواجهها من قبل.
ويقول الباحثون إن هذا البحث كان مدفوعًا بسؤال أساسي هو ماذا لو تمكنت الروبوتات ذات الأرجل من التحرك غريزيًا كما تفعل الحيوانات؟
وأوضحوا: "بدلاً من تدريب الروبوتات على مهام محددة، أردنا أن نمنحها الذكاء الاستراتيجي الذي تستخدمه الحيوانات لتكييف أنواع مشيتها، باستخدام مبادئ مثل التوازن، التنسيق، وكفاءة الطاقة".
ومن خلال تضمين هذه المبادئ في نظام ذكاء اصطناعي، تمكنت الروبوتات من اختيار كيفية التحرك بناءً على الظروف في الوقت الفعلي، وليس القواعد المبرمجة مسبقًا، ما يعني أنها يمكنها التنقل في بيئات غير مألوفة بأمان وفعالية، حتى تلك التي لم تواجهها من قبل.
وتتمثل رؤية الباحثين طويلة الأمد في تطوير أنظمة ذكاء اصطناعي مجسدة - بما في ذلك الروبوتات الشبيهة بالبشر - تتحرك وتتكيف وتتفاعل بنفس السلاسة والمرونة التي تتمتع بها الحيوانات والبشر، ويُقلد المهندسون بشكل متزايد الطبيعة – المعروفة باسم المحاكاة الحيوية – لحل تحديات التنقل المعقدة.
وأوضح فريق الباحثين أن النظام يمثل خطوة رئيسية في جعل الروبوتات ذات الأرجل أكثر قابلية للتكيف وقدرة على التعامل مع تحديات العالم الحقيقي، في البيئات الخطرة أو حيث يصعب الوصول؛ موضحين أن الروبوت القادر على التنقل في تضاريس معقدة وغير مألوفة يفتح إمكانيات جديدة لاستخدامه في الاستجابة للكوارث، واستكشاف الكواكب، والزراعة، وتفتيش البنية التحتية.
ويُقدم هذا النظام مسارًا واعدًا لدمج الذكاء البيولوجي في أنظمة الروبوتات، وإجراء تحقيقات أكثر أخلاقية لفرضيات الميكانيكا الحيوية؛ فبدلًا من إثقال كاهل الحيوانات بأجهزة استشعار غازية أو تعريضها للخطر لدراسة استجابتها لاستعادة الاستقرار، يمكن استخدام الروبوتات بدلاً منها.
القدرة التكيفية
باستخدام التعلم المعزز العميق - يُشبه عملية التجربة والخطأ فائقة القوة - تدرب الروبوت في مئات البيئات في وقت واحد، ليحل أولاً تحدي الحركة بأنواع مشي مختلفة ثم اختيار أفضل نوع مشي للتضاريس، ما أدى إلى توليد الأدوات اللازمة لتحقيق حركة عالية التكيف.
ولاختبار هذه القدرة التكيفية المكتسبة في العالم الحقيقي، أُطلق الروبوت في بيئات حقيقية تشمل رقائق الخشب، والصخور، والجذور المتضخمة، والأخشاب المتناثرة.
كما تم ضرب أرجل الروبوت مرارًا بفرشاة كنس، لاختبار قدرته على التعافي من العثرات، واستخدم الفريق مسارًا مبرمجًا أو عصا تحكم (جو-ستيك) لتوجيه الروبوت.
التعلم المعزز العميق
طريقة تدريب للذكاء الاصطناعي تجمع بين:
التعلم المعزز (Reinforcement Learning): يتعلم من التجربة والخطأ/ والمكافأة والعقاب.
التعلم العميق (Deep Learning): يستخدم شبكات عصبية عميقة لتحليل بيانات معقدة.
الهدف: اتخاذ قرارات ذكية لتحقيق أفضل نتيجة بمرور الوقت.
يستخدم في: الألعاب الروبوتات السيارات ذاتية القيادة أنظمة التداول الذكية
ولم يتعرض الروبوت لأي تضاريس وعرة أثناء التدريب، ما يُسلط الضوء على قدرة النظام على التكيف ويُظهر أن هذه المهارات أصبحت غريزية تقريبًا للروبوت.
وعلى الرغم من أن هذا الإطار جرى اختباره حتى الآن على روبوت واحد رباعي الأرجل بحجم الكلب، إلا أن المبادئ الأساسية قابلة للتطبيق على نطاق واسع؛ إذ يمكن استخدام نفس المقاييس المستوحاة من البيولوجيا عبر مجموعة واسعة من الروبوتات رباعية الأرجل، بغض النظر عن الحجم أو الوزن، طالما أنها تشترك في مورفولوجيا -شكل وبنية- مماثلة.