كشفت شركة XAI، المملوكة للملياردير الأميركي إيلون ماسك، عن الجيل الجديد من نموذجها للذكاء الاصطناعي Grok-1.5، والمزود بقدرات متطورة تجعل منه منافساً مباشراً في وجه نموذج GPT-4، الذي أطلقته شركة OpenAI، وتستخدمه منصة ChatGPT.
وبحسب الشركة، فإن الإصدار الجديد سيتوفر خلال الأيام المقبلة، ليقدم قدراته الجديدة عبر منصة الدردشة الذكية "جروك"، المتاحة للمشتركين في باقة "إكس بريميوم" المدفوعة على منصة "إكس" الاجتماعية.
وسلطت الشركة الناشئة الضوء على نتائج اختبارات Grok-1.5، والتي تخطى فيها أداء عدد من النماذج الذكية المنافسة، فقد حقق نسبة 50.6% في اختبار MATH، و90% في اختبار GSM8K، وكلاهما متعلق بمسائل ومعادلات حسابية يدرسها طلاب المرحلتين الإعدادية والثانوية، إلى جانب حصول النموذج على 74.1% في اختبار HumanEval، والمتعلق بإنشاء الأكواد البرمجية وقدرات حل المشكلات.
نتائج تنافسية
وتفوق الجيل الجديد من جروك في تلك الاختبارات على نماذج ذكاء اصطناعي مثل Mistral Large المطور من شركة ميكسترال الفرنسية، وكذلك نماذج كلاوديه 3 من شركة أنثروبيك، إلى جانب نموذج جيميناي برو 1.5 من جوجل، وGPT-4 من أوبن إيه آي.
ولكن على مستوى القدرة على استيعاب الأوامر، فعلى الرغم من رفع "إكس إيه آي" من إمكانيات النموذج الجديد على إدراك أمر نصي من المستخدم بحجم 128 ألف توكين، وهي وحدة قياس الأوامر الموجهة إلى النماذج اللغوية الضخمة LLM، إلا أنه ما زال أقل بشكل واضح؛ مما تقدمه جوجل مع "جيميناي برو 1.5" والذي وصل حجم الأمر النصي إلى مليون توكين.
وتتطلب أبحاث نماذج اللغة الضخمة المتطورة كماً هائلاً من الطاقة والقوة الحاسوبية، لذا فإن تشغيل النماذج وتدريبها يحتاج إلى شبكات من بطاقات الرسوميات فائقة الأداء لتقديم بنية تحتية قوية ومرنة، ولكن الشركة الناشئة أشارت إلى أن تصميم Grok-1.5 اعتمد على أطر عمل برمجية متطورة.
وتابعت الشركة: "هذا النهج في تشغيل نماذجنا الذكية أتاحت لمهندسينا وضع نماذج أولية للأفكار وتدريب بنيات جديدة على نطاق واسع بأقل قوة حاسوبية.. إلى جانب ذلك فإننا نستخدم أساليب متطورة لاكتشاف نقاط ضعف الأداء في شبكات تدريب نماذجنا، بحيث يتم التخلص منها تلقائياً وإخراجها من مهمة التدريب، مما يحسن من عمليات التدقيق وتحميل البيانات وإعادة تشغيل مهمة التدريب، لتقليل وقت التوقف عن العمل في حالة حدوث فشل في التدريب".
يأتي إطلاق الجيل الثاني من جروك بعد أيام قليلة من نشر الشركة الناشئة الكود المصدري لنموذج الجيل الأول Grok-1، لعموم مجتمع الباحثين والمطورين.
وأوضحت الشركة أن النسخة المتاحة حالياً من نموذج Grok-1 هي الخام من النموذج، حيث إنها لا تتضمن أي عمليات تدريب أو ضبط وتهيئة للبيانات داخل النموذج، وبالتالي فإن المطورين والباحثين سيحتاجون إلى خوض عملية تهيئة "جروك" من البداية لجعله يخدم أهدافهم، فالنموذج الحالي لا يدعم القيام بأي مهام حتى الدردشة.