"النماذج الذكية ستعلم نفسها".. طرح جديد من جوجل لحل مشكلة ندرة البيانات

مقر "جوجل ديب مايند" في لندن - Bloomberg
مقر "جوجل ديب مايند" في لندن - Bloomberg
القاهرة-الشرق

أشعلت شركة جوجل مجدداً التنافس المحتدم في سباق تطوير أنظمة الذكاء الاصطناعي من خلال طرحها لبحث علمي ثوري، أُطلق عليه اسم "عصر التجربة Era of Experience". 

ويتناول البحث الذي شارك فيه الباحث البارز بالشركة ديفيد سيلفر، وعالم الحوسبة الكندي ريتش ساتون، واحدة من أبرز التحديات التي تواجه القطاع حالياً، وهي مشكلة ندرة البيانات المتاحة لتدريب نماذج الذكاء الاصطناعي، مقترحين أن تتم معالجتها عبر جعل النماذج نفسها تولد بياناتها الخاصة من خلال تفاعلها المباشر مع العالم الحقيقي.

التوجه الجديد اعتبره بعض الخبراء بمثابة انتقاد غير مباشر لنهج شركة OpenAI والتي اعتمدت خلال الفترة الماضية على استخدام المحتوى المنتج بواسطة البشر على الإنترنت لتدريب نماذجها الذكية، وهو ما يعكس حجم التحول في المفاهيم الذي يسعى فريق جوجل إلى ترسيخه في مستقبل الذكاء الاصطناعي. 

كتب المؤسس المشارك لشركة أنثروبيك، جاك كلارك، في نشرته الأسبوعية Import AI، التي يتابعها الآلاف من خبراء القطاع، أن هذا الطرح يُجسد الجرأة والثقة التي بدأت تتجذر في أوساط مطوري الذكاء الاصطناعي. 

كما وصف رائد الأعمال سهيل دوشي الورقة، بأنها أكثر ما ألهمه في المجال خلال العامين الماضيين.

مراحل تطور الذكاء الاصطناعي

استعرض البحث تطور الذكاء الاصطناعي الحديث عبر ثلاث مراحل رئيسية، فالمرحلة الأولى أطلق عليها مؤلفا الدراسة اسم "عصر المحاكاة Era of Simulation"، وهي تعود إلى منتصف العقد الماضي، وكان الباحثون يعتمدون خلالها على محاكاة رقمية مكثفة لتدريب نماذج الذكاء الاصطناعي مثل AlphaGo التابع لجوجل، الذي تمكن من التغلب على البشر في لعبة Go عام 2015، وكذلك نموذج AlphaZero الذي اكتشف استراتيجيات جديدة في ألعاب الشطرنج، وGo، وغير الطريقة التي يتعامل بها البشر مع هذه الألعاب. 

واعتمد تدريب تلك النماذج خلال الـ 15 عاماً الماضية على خوض النماذج لملايين المباريات الافتراضية في ألعاب الشطرنج، والبوكر، وألعاب الأتاري، بل وحتى ألعاب قيادة السيارات مثل Gran Turismo، وذلك باستخدام آلية تُكافئ النموذج عند تحقيق نتائج إيجابية. 

وتلك المنهجية المعروفة باسم التعلم المعزز Reinforcement Learning، أظهرت فاعلية كبيرة في المهام المحددة والمغلقة، لكنها عجزت عن التعامل مع التحديات المفتوحة والمعقدة التي لا تملك أهدافاً واضحة أو محددة، حسب ما يشير إليه الباحثان.

أما المرحلة الثانية، فهي ما يسمى بعصر البيانات البشرية Era of Human Data، وقد انطلقت شرارتها من ورقة بحثية نشرتها جوجل عام 2017 بعنوان Attention is All You Need.

واقترحت تلك الورقة تدريب نماذج الذكاء الاصطناعي على كميات هائلة من البيانات التي أنتجها البشر عبر الإنترنت، واعتمد هذا النهج على تمكين الآلات من "الانتباه" لكل تلك البيانات، وتعلم الأنماط والسلوكيات البشرية من خلالها. 

وكانت هذه الفكرة حجر الأساس الذي أُسست عليه النماذج التوليدية الحديثة التي شغلت منصات مثل ChatGPT، وأدوات أخرى تقوم بأتمتة عمليات مثل تصميم الصور، وإنشاء المحتوى، وكتابة الشيفرات البرمجية. 

ووفق تلك المنهجية، اعتمد الباحثون في تطوير وتدريب نماذج الذكاء الاصطناعي على جمع أكبر قدر ممكن من البيانات عالية الجودة التي ينتجها البشر، ومن ثم تدريب النماذج باستخدام حوسبة عالية الأداء، وذلك بهدف تقريب الذكاء الاصطناعي من الفهم البشري للعالم.

ومع أن جوجل كانت صاحبة الريادة في هذا النهج، إلا أن كثير من الباحثين الذين طوروا هذا المفهوم غادروا الشركة لاحقاً، فبعضهم انضم إلى OpenAI وساهم في تطوير ChatGPT، الذي يُعد أنجح منتج ذكاء اصطناعي توليدي حتى الآن، فيما أسس آخرون شركة أنثروبيك وتدير الآن منصة الذكاء الاصطناعي "كلاودي".

ويلفت الباحثان النظر إلى معضلة متنامية في هذا السياق، وهي أن الطلب المتزايد على البيانات البشرية عالية الجودة تجاوز العرض المتاح، ما أدى إلى ارتفاع تكاليف تطوير النماذج بشكل كبير، وصعوبة إحراز تقدم نوعي في قدراتها، مما يدفع إلى البحث عن حلول خارج هذا النطاق المحدود، وهنا يظهر الطرح الجذري الجديد للباحثَين، وهو "عصر التجربة". 

عصر التجربة

المرحلة المقترحة تقوم على تمكين وكلاء الذكاء الاصطناعي من التفاعل مباشرة مع العالم الخارجي، وتوليد بياناتهم الخاصة، بدلاً من الاعتماد على المحتوى البشري. 

ويقول الباحثان إن هذا النموذج الجديد سيحل أزمة توفر البيانات، وسيساهم في الاقتراب من تحقيق الهدف الأسمى في هذا المجال، وهو الذكاء الاصطناعي العام (AGI)، الذي يعني قدرة الآلات على التفوق على البشر في معظم المهام المفيدة.

أضاف الباحثان: "في نهاية المطاف، ستتجاوز البيانات التجريبية في الحجم والجودة البيانات التي يُنتجها الإنسان، وهذا التحول مدفوعاً بتطورات خوارزميات التعلم المعزز، سيفتح أبواباً جديدة للقدرات في مجالات متعددة، تتجاوز ما يمكن لأي إنسان تحقيقه".

ولشرح هذه الفكرة، ضربت الورقة البحثية أمثلة نظرية، مثل مساعد صحي يعمل بالذكاء الاصطناعي قد يُخصص أهدافاً صحية شخصية بناءً على معدل نبض القلب، ومدة النوم، ومستويات النشاط البدني، بينما قد يستخدم مساعد تعليمي نتائج الامتحانات كوسيلة لتعزيز تعلم اللغات، في حين يمكن لوكيل علمي لديه هدف الحد من الاحتباس الحراري أن يستند إلى الملاحظات البيئية المتعلقة بمستويات ثاني أكسيد الكربون، لتحديد كيفية عمله.

وفي جوهره، يمثل "عصر التجربة" عودة إلى فلسفة "عصر المحاكاة" لكنه يتخطى حدوده من خلال نقل تجربة التعلم إلى العالم الحقيقي بدلاً من الاكتفاء بالمحاكاة الرقمية أو الألعاب الإلكترونية، ويتوقع الباحثان أن يفتح هذا التحول آفاقاً غير محدودة، إذ لن يعود هناك سقف لكمية أو نوعية البيانات التي يمكن للوكلاء جمعها.

تصنيفات

قصص قد تهمك