تمكن باحثون في جامعتي ستانفورد وواشنطن الأميركيتين من تطوير نموذج ذكاء اصطناعي يسمى s1، بتكلفة تقل عن 50 دولاراً، ويُظهر أداءً مشابهاً لنماذج متقدمة مثل o1 من شركة OpenAI، وR1 الصادر عن DeepSeek في اختبارات تقيس القدرات الرياضية والبرمجية، بحسب ورقة بحثية.
وبدأ الفريق بنموذج أساسي متوفر، ثم قاموا بتحسينه عبر عملية تُسمى التقطير Distillation، وهي عملية استخراج قدرات الاستدلال من نموذج ذكاء اصطناعي آخر من خلال التدريب على إجاباته، وهو حالياً متاح على منصة GitHub.
أفاد الباحثون بأن s1 تم تقطيره من أحد نماذج الاستدلال الخاصة بشركة جوجل، وهو Gemini 2.0 Flash Thinking Experimental، وتُعد هذه الطريقة مشابهة لما استخدمه باحثون في جامعة بيركلي الشهر الماضي لإنشاء نموذج استدلال بتكلفة حوالي 450 دولاراً.
يثير هذا التطور تساؤلات بشأن إمكانية تكرار نماذج باهظة التكلفة بميزانيات محدودة، بعدما اتهمت OpenAI شركة DeepSeek بجمع بيانات من واجهات برمجة التطبيقات الخاصة بها بشكل غير مناسب لغرض التقطير.
وسعى الباحثون إلى إيجاد أبسط الطرق لتحقيق أداء استدلال قوي وزيادة وقت التفكير للنموذج قبل تقديم الإجابة، وتشير الورقة البحثية إلى أن نماذج الاستدلال يمكن تقطيرها باستخدام مجموعة بيانات صغيرة نسبياً، عبر عملية تُسمى التدريب الدقيق الخاضع للإشراف (SFT)، إذ يُطلب من النموذج محاكاة سلوكيات معينة في مجموعة البيانات.
تُعد استراتيجية SFT أقل تكلفة من طريقة التعلم المعزز واسعة النطاق التي استخدمتها DeepSeek لتدريب نموذجها المنافس لـo1 من OpenAI، والمعروف بـR1.
توفر جوجل وصولاً مجانياً إلى Gemini 2.0 Flash Thinking Experimental عبر منصة Google AI Studio، مع وجود حدود يومية، ومع ذلك، تحظر شروط جوجل إعادة هندسة نماذجها لتطوير خدمات تنافس عروضها الخاصة بالذكاء الاصطناعي.
يعتمد s1 على نموذج صغير متوفر من مختبر Qwen الصيني المملوك لشركة علي بابا، وهو متاح للتنزيل مجاناً.
ولتدريب s1، أنشأ الباحثون مجموعة بيانات تضم 1000 سؤال مُختارين بعناية، مع إجاباتها وعملية التفكير وراء كل إجابة من داخل نموذج جوجل Gemini 2.0 Flash Thinking Experimental، والذي أطلقته في ديسمبر.
واستغرق تدريب s1 أقل من 30 دقيقة باستخدام 16 وحدة معالجة رسومات من نوع Nvidia H100.
الانتظار كلمة السر
استخدم الباحثون حيلة لجعل s1 يتحقق من عمله ويزيد من وقت تفكيره، من خلال إضافة كلمة انتظر wait أثناء عملية الاستدلال، مما ساعد النموذج في الوصول إلى إجابات أكثر دقة.
وخلال هذا العام تخطط شركات مثل ميتا، وجوجل، ومايكروسوفت لاستثمار مئات المليارات من الدولارات في بنية تحتية للذكاء الاصطناعي، جزء منها سيُخصص لتدريب نماذج الجيل التالي.
وقد يكون هذا المستوى من الاستثمار ضرورياً لدفع حدود الابتكار في مجال الذكاء الاصطناعي، فقد أثبتت عملية التقطير أنها طريقة جيدة لإعادة إنشاء قدرات نموذج ذكاء اصطناعي بتكلفة منخفضة، لكنها لا تخلق نماذج جديدة تتفوق بشكل كبير على المتاح حالياً.