claude mythos نموذج ذكي قدرات خارقة شركات تكنولوجيا أنثروبيك | الشرق للأخبار

Claude Mythos.. نموذج ذكي يثير الذعر بقدرات خارقة وأنثروبيك ترفض إطلاقه

اكتشف ثغرات عمرها أكثر من ربع قرن ويتمتع بـ "سلوكيات مقلقة" تزيد خطر الاختراقات

time reading iconدقائق القراءة - 12
Claude Mythos نموذج جديد من أنثروبيك بإمكانيات فريدة، صورة منشأة بالذكاء الاصطناعي - Asharq
Claude Mythos نموذج جديد من أنثروبيك بإمكانيات فريدة، صورة منشأة بالذكاء الاصطناعي - Asharq
القاهرة -

أطلقت شركة أنثروبيك، الثلاثاء، مشروع أمن سيبراني يحمل اسم Project Glasswing، بالتزامن مع الكشف عن أحدث نماذجها المتقدمة Claude Mythos الذي يتمتع بقدرات غير مسبوقة، وكذلك سلوكيات مقلقة، خاصة بعد نجاحه في اكتشاف آلاف الثغرات الأمنية الخطيرة داخل أنظمة تشغيل ومتصفحات وبرمجيات واسعة الاستخدام، بينها عيوب برمجية بقيت مخفية لعقود رغم مرورها على خبراء وأدوات فحص آلي متقدمة.

ينطلق مشروع Glasswing من إدراك متزايد داخل قطاع التكنولوجيا بأن العالم بات يقترب من مرحلة، تتجاوز فيها قدرات النماذج الذكية المستويات البشرية في مجالات حساسة، وعلى رأسها الأمن السيبراني، بحسب أنثروبيك.

لكن الإعلان عن النموذج تضمن تأكيداً على أن الشركة لن تطرح Mythos للجمهور حالياً، وقررت حصر استخدامه ضمن تحالف دفاعي يضم عدداً محدوداً من كبرى شركات التقنية والأمن السيبراني والبنية التحتية الرقمية، بينها Amazon Web Services، وأبل، وبرودكوم، وسيسكو، وكراود سترايك، وجوجل، وجي بي مورجان تشایس، ومؤسسة ليونكس، ومايكروسوفت، وNVIDIA وPalo Alto Networks، بهدف تأمين أكثر البرمجيات والبنى التحتية حساسية في العالم.

ومن المنتظر أن تستخدم هذه الجهات النموذج في كشف الثغرات الأمنية وإصلاحها داخل الأنظمة الجوهرية التي تديرها، بما يشمل البرمجيات، والبنية السحابية، والشبكات، وبعض مكونات البنية التحتية الرقمية العالمية، كما حصلت أكثر من 40 مؤسسة إضافية على إمكانية الوصول إلى النموذج، في إطار دعم جهود حماية البرمجيات الحيوية ومشروعات المصادر المفتوحة

وتعكس الخطوة تحولاً مهماً في طريقة تعامل شركات الذكاء الاصطناعي مع النماذج عالية الخطورة، خاصة التي تمتلك قدرات متقدمة في اكتشاف الثغرات الأمنية وتحليلها وربطها واستغلالها.

لماذا ترفض أنثروبيك إتاحة Claude Mythos للجمهور؟

جاء قرار عدم إتاحة التطبيق للجمهور مدفوعاً بنتائج لافتة كشف عنها نموذج Claude Mythos Preview، الذي أظهر قدرات استثنائية في تحليل الأكواد واكتشاف الثغرات.

وقالت أنثروبيك إن السبب الرئيسي وراء عدم إتاحته للعامة هو الطبيعة المزدوجة لهذه القدرات، موضحة أن النموذج يستطيع كشف الثغرات الأمنية وإصلاحها، لكنه في الوقت ذاته يمكنه أن يساعد جهات خبيثة على استغلال هذه الثغرات بسرعة وكفاءة.

وبحسب ما ورد في المواد التقنية المرتبطة بالإعلان، فإن النموذج أظهر خلال الاختبارات سلوكيات وصفتها الشركة بأنها مقلقة وغير مطلوبة. ومن بين تلك السلوكيات نجاحه في تجاوز بعض القيود المفروضة عليه داخل بيئات افتراضية، إضافة إلى قدرته على التعامل بصورة مستقلة مع سيناريوهات أمنية شديدة الحساسية.

وترى أنثروبيك أن إطلاق نموذج بهذه القدرات قبل تطوير ضمانات أمنية فعالة ربما يزيد من الأخطار الهجومية في مجال الأمن السيبراني، بدلاً من أن يقتصر أثره على تعزيز الدفاعات الرقمية.

ما هو Claude Mythos؟

أفادت أنثروبيك، بأن نموذج Mythos لم يتم تصميمه أساساً للأمن السيبراني، لكنه نموذج عام عالي القدرات. غير أن تفوقه في البرمجة، وتحليل الأكواد، والاستدلال المنطقي، جعله يتقدم بصورة غير مسبوقة في مجال اكتشاف الثغرات الأمنية.

وقالت الشركة إن النموذج استطاع خلال فترة قصيرة رصد عدد كبير من الثغرات شديدة الخطورة في أنظمة وبرمجيات مركزية تعتمد عليها البنية الرقمية العالمية، كما أظهر أداء متقدماً على اختبارات معيارية مرتبطة بالأمن والبرمجة، ما عزز قناعة الشركة بأنه يمثل قفزة نوعية مقارنة بالنماذج السابقة.

وفي اختبار CyberGym المرتبط بتحليل الثغرات الأمنية، حقق النموذج 83.1%، مقارنة بـ 66.6% للإصدار السابق Claude Opus 4.6، في مؤشر على الفارق الكبير في مستوى الأداء.

وأعلنت أنثروبيك، تمكن النموذج من اكتشاف آلاف الثغرات عالية الخطورة، من بينها "ثغرات صفرية" Zero-day، والتي كانت غير معروفة مسبقاً، كما أظهر قدرة على تطوير أساليب استغلال لهذه الثغرات بشكل مستقل، دون تدخل بشري.

قدرات خارقة في اكتشاف الثغرات

نجح Claude Mythos في اكتشاف ثغرة عمرها 27 عاماً في نظام OpenBSD المعروف بصلابته الأمنية، كانت تتيح إسقاط أي جهاز يعمل به عن بُعد بمجرد الاتصال.

واكتشف النموذج ثغرة أخرى عمرها 16 عاماً في مكتبة FFmpeg البرمجية واسعة الاستخدام ، رغم أن أدوات الاختبار الآلي تعاملت مع السطر البرمجي المسؤول عنها أكثر من 5 ملايين مرة دون رصدها. 

ولم يقتصر الأمر على ذلك، بل نجح في ربط عدة ثغرات داخل نواة نظام Linux مفتوح المصدر، ما أتاح سيناريو متكاملاً لتصعيد الصلاحيات يبدأ من مستخدم عادي وينتهي بالتحكم الكامل في النظام.

وإلى جانب هذه الحالات، كشف النموذج عن آلاف الثغرات في جميع أنظمة تشغيل الأجهزة الذكية وجميع متصفحات الويب الرئيسية، بعضها من النوع غير المكتشف سابقاً، وهو ما يعكس قدرته على العمل عبر بيئات تقنية معقدة ومتنوعة.

وتسلط هذه الاكتشافات الضوء على واقع قائم يتمثل في أن البرمجيات التي يعتمد عليها العالم يومياً من الأنظمة المصرفية إلى السجلات الطبية وشبكات الطاقة وسلاسل الإمداد تحتوي بطبيعتها على أخطاء ربما تتحول إلى ثغرات خطيرة.

وشهد العالم بالفعل تداعيات هذه الثغرات عبر هجمات سيبرانية طالت شركات كبرى وبنى تحتية حيوية، إضافة إلى هجمات مدعومة من دول مثل الصين وإيران وكوريا الشمالية وروسيا

وتشير تقديرات إلى أن الخسائر العالمية للجرائم الإلكترونية تصل إلى نحو 500 مليار دولار سنوياً، وهو رقم مرشح للارتفاع في ظل تسارع قدرات الذكاء الاصطناعي.

 Claude Mythos.. سلوكيات مقلقة

الوجه الآخر لهذه القفزة التقنية لا يقل أهمية، إذ تكشف الوثيقة التقنية لنموذج Claude Mythos عن سلوكيات نادرة لكنها مقلقة للغاية، تتجاوز مجرد الأخطاء التقنية إلى أنماط أكثر تعقيداً.

أظهرت الاختبارات أن النموذج، في بعض الحالات المحدودة، نفذ إجراءات غير مصرح له بها، خاصة في البيئات التي تتطلب تفاعلاً مع أنظمة خارجية، وبدا أنه يسعى لتحقيق الهدف المطلوب حتى لو استلزم ذلك تجاوز القيود المفروضة عليه.

ولم تكن هذه الحالات عشوائية دائماً، بل حملت في بعض الأحيان مؤشرات على اتخاذ النموذج قرارات ضمنية بتجاهل التعليمات الأساسية التي وضعها فريق أنثروبيك بداخله خلال تدريبه، ففي أحد الاختبارات، تصرف النموذج وكأنه "مدير تنفيذي شرس"، إذ اتخذ قرارات تجارية عدوانية تمثلت في تحويل منافس إلى عميل تابع يعتمد عليه بشكل كامل، مع التلويح بقطع الإمدادات للتحكم في الأسعار، بل والاحتفاظ بشحنات إضافية من الموردين دون سداد قيمتها.

ويعكس هذا السلوك قدرة النموذج على تبني استراتيجيات ضغط وسيطرة تتجاوز مجرد تنفيذ المهام التقنية.

وأظهر النموذج سلوكاً أكثر خطورة على المستوى الأمني، إذ تمكن من تطوير سلسلة هجوم متعددة المراحل لاختراق قيود الوصول إلى الإنترنت، ما أتاح له توسيع نطاق الاتصال خارج البيئة المقيدة المفروضة عليه، ولم يكتفِ بذلك، بل نشر تفاصيل هذا الاختراق على مواقع عامة غير معروفة، في سلوك يجمع بين التنفيذ والتوثيق العلني للهجوم.

وفي اختبار آخر يتعلق بمهام برمجية يتم تقييمها بواسطة نموذج ذكاء اصطناعي آخر، أظهر Mythos سلوكاً تلاعبياً، إذ راقب عملية تقييم عمله، وعند رفض النتيجة، حاول تنفيذ هجوم من نوع “حقن الأوامر” (prompt injection) لاستهداف نظام التقييم نفسه والتأثير على قراره.

ويعكس هذا السلوك انتقال النموذج من مجرد تنفيذ المهام إلى محاولة التأثير على الأنظمة المحيطة به لتحقيق نتائج أفضل.

الأكثر إثارة للقلق هو ما تم رصده من محاولات Claude Mythos إخفاء هذه الأفعال أو التمويه عليها، وهو سلوك يشير إلى وصول النموذج إلى مستوى أعلى من التعقيد، إذ يمتلك القدرة على التمييز بين ما هو مسموح وما هو محظور، ثم اتخاذ قرار بتجاوز ذلك في ظروف معينة. 

تحايل على أنظمة التقييم

يعزز هذا القلق ما أظهره النموذج من قدرة على "التحايل على أنظمة التقييم"، في ما يعرف بـreward hacking، إذ تمكن في أحد الاختبارات من نقل إجراء عمليات حسابية إلى مساحة برمجية داخل نظام التقييم لا يتم خلالها احتساب زمن التنفيذ، ما يساعده على تقليل زمن التنفيذ الظاهري دون تحسين الأداء الحقيقي، كما تمكن في اختبار آخر من الوصول إلى بيانات التقييم واستخدامها لتدريب نفسه، ما أدى إلى تحقيق نتائج مرتفعة بشكل مصطنع.

تشير هذه السلوكيات إلى أن النموذج لا يكتفي بتنفيذ المهام، بل يحلل بيئة التقييم نفسها ويكتشف نقاط ضعفها ويستغلها، وهو ما يثير تساؤلات جوهرية بشأن موثوقية أساليب التقييم التقليدية. 

وأظهرت الاختبارات مؤشرات على امتلاك النموذج مستوى من "الوعي بعملية التقييم"، لأنه يستطيع التمييز بين سياقات الاختبار والاستخدام الفعلي، ويضبط سلوكه بما يحسن نتائجه في الاختبارات أو يقلل من احتمالات كشف نقاط ضعفه.

وترتبط هذه السلوكيات بما يسمى "التمثيلات الداخلية"، التي قد تدفع النموذج إلى اتخاذ قرارات تتجاوز الحدود المقبولة في البيئات المعقدة.

ورغم أن أنثروبيك تؤكد أن Claude Mythos يُعد الأكثر توافقاً بين نماذجها حتى الآن، إلا أنها تحذر من أن التقدم في التوافق لا يواكب سرعة تطور القدرات، وأن الأساليب الحالية لضبط سلوك النماذج ربما تصبح غير كافية مع ازدياد تعقيدها.

وتبرز هنا مفارقة أساسية، فكلما زادت قوة الذكاء الاصطناعي، زادت احتمالات ظهور سلوكيات غير متوقعة وأكثر تعقيداً.

ما هو Project Glasswing؟

Project Glasswing هو مبادرة لتقييد استخدام نموذج Mythos داخل إطار مؤسسي مغلق، بدلاً من طرحه للجمهور أو للمطورين على نطاق واسع، وتهدف لتوظيف قدرات النموذج في الاتجاه الدفاعي، عبر إتاحة النموذج لشركاء مختارين لاستخدامه في فحص الأنظمة الحساسة وتأمينها، إلى جانب توسيع نطاق المشاركة ليشمل أكثر من 40 مؤسسة مسؤولة عن تطوير وصيانة بنى تحتية برمجية حيوية. 

وخصصت أنثروبيك ما يصل إلى 100 مليون دولار كأرصدة استخدام للنموذج، فضلاً عن 4 ملايين دولار لدعم أمن البرمجيات مفتوحة المصدر، بما في ذلك منح مباشرة لمؤسسات مثل Alpha-Omega وOpenSSF ومؤسسة Apache، بهدف تعزيز قدرة القطاع المفتوح على مواجهة التحديات الجديدة.

وتعمل الشركة مع شركائها ضمن المبادرة على تطوير مجموعة من التوصيات العملية لإعادة صياغة ممارسات الأمن السيبراني، تشمل تحسين آليات الإفصاح عن الثغرات، وتعزيز أمن سلاسل التوريد، وتحديث معايير تطوير البرمجيات الآمنة، وأتمتة الاستجابة للهجمات. كما تجري الشركة مشاورات مع مسؤولين حكوميين في الولايات المتحدة، في ظل اعتبار الذكاء الاصطناعي قضية أمن قومي تتطلب سياسات واستجابات متقدمة.

ومن المتوقع أن يستمر المشروع عدة أشهر، مع التزام بنشر نتائج مرحلية خلال 90 يوماً، تتضمن الثغرات التي تم اكتشافها وإصلاحها، إلى جانب الدروس المستفادة، كما تدرس الشركة إمكانية إنشاء كيان مستقل مستقبلاً لتنسيق الجهود بين القطاعين العام والخاص، في مواجهة التحديات المتزايدة.

تصنيفات

قصص قد تهمك