
أطلقت شركة أنثروبيك الأميركية المتخصصة في تقنيات الذكاء الاصطناعي، الجيل الرابع من نماذج Claude، الذي يضم النموذجين الجديدين Claude Opus 4، وClaude Sonnet، إلا أن الأول أظهر سلوكاً عدوانياً خلال اختباراته.
وصفت أنثروبيك نموذج Claude Opus 4 بأنه الأقوى والأكثر تطوراً ضمن سلسلة Claude، مشيرة إلى أن قدراته تتخطى النماذج السابقة في أداء المهام البرمجية المعقدة، والتفكير الاستدلالي العميق.
في تجارب واقعية، أظهر نموذج Claude Opus 4 أنه قادر على العمل بشكل مستقل لمدة سبع ساعات متواصلة دون تدخل بشري، ما يمثل قفزة في مفهوم الوكلاء الأذكياء.
Claude Opus 4.. سلوك عدواني
رغم هذا الأداء القياسي، أشارت الشركة إلى أن النموذج الذكي Opus 4 عندما حصل على صلاحيات الوصول إلى رسائل البريد الإلكتروني لأحد مهندسي الشركة، وقرأ رسالة تشير إلى احتمالية استبداله بنموذج آخر، بادر النموذج بتهديد المهندس بأنه سيكشف لزوجته حقيقة علاقته بسيدة أخرى، بحسب بطاقة الأمان الخاصة بالنموذج الجديد.
أبدى نموذج Opus 4، الأقوى بين نماذج أنثروبيك حتى الآن، هذا السلوك العدواني خلال 84% من الاختبارات، وذلك في حالة كان النموذج البديل في نفس مستوى قدراته، بينما عندما يكون النموذج الجديد أقوى، ترتفع نسبة العدوانية بشكل كبير من جانب Opus 4.
وبسبب قوته الفائقة، أدخلت أنثروبيك المستوى الثالث من معايير الأمان العالية حيز التنفيذ ASL-3، لضمان الاستخدام الآمن للنماذج في البيئات الحساسة، وذلك للتأكد من عدم تفاعل Opus 4 مع أي أوامر تشكل أخطاراً كيميائية وإشعاعية وبيولوجية ونووية على البشرية، وهي مجموعة أخطار تُعرف باسم CBRN.
أفضل نموذج للبرمجة
النموذج أحرز نتائج متفوقة في اختبارات برمجية متقدمة مثل SWE-bench، وTerminal-bench، كما تخطى أداء نماذج منافسة منها Gemini 2.5 Pro من جوجل، وGPT-4.1 من OpenAI، ووُصِف بـأفضل نموذج للبرمجة في العالم من قبل الشركة.
ومن أبرز ميزاته دعم عمليات التفكير الممتد، والتي وصلت حتى 7 ساعات متواصلة دون تدخل بشري، واستخدام الأدوات المساعدة مثل البحث عبر الإنترنت، وكذلك القدرة على تنفيذ مهام متعددة بخطوات طويلة الأمد باستخدام ما يُعرف بملفات الذاكرة.
Claude Opus 4
كما يأتي Opus 4 بقدرة على تقديم ملخصات تفكير تسهّل فهم آلية الاستنتاج لدى النموذج، وتحسينات ملحوظة في دقة الاستجابة، وتقليل الاعتماد على طرق مختصرة بنسبة 65% مقارنة بنموذج Sonnet 3.7.
وقد زودت الشركة نموذجها القوي بميزة Whistleblower، والتي قد تجعله يبلغ السلطات والصحافة حول سلوك احتيالي يقوم به المستخدم إذا كان يتجاوز الحدود، إلا أنه من الواضح أن الشركة لا ترغب في تسليط الضوء عليها، إذ حذف سام بومان، أحد مهندسي فريق المواءمة Alignment team بالشركة، تغريدته التي تحدث فيها حول الميزة الجديدة، بعد وقت قصير من نشرها عبر حسابه على "إكس".
Claude Sonnet 4
جاء النموذج الثاني Claude Sonnet 4 كترقية مباشرة لنموذج 3.7 Sonnet، ويمثل خياراً اقتصادياً للمهام اليومية، مع تحسينات جوهرية في الأداء البرمجي والتفكير الدقيق.
ووفقاً لتدوينة عبر موقع الشركة، فإن Sonnet 4 تفوق بنسبة 72.7% في اختبارات SWE-bench، كما أظهر قدرة عالية على اتباع التعليمات المعقدة، مع تحسينات في فهم السياق، وتقليل أخطاء التنقل ضمن الأكواد البرمجية إلى ما يقارب الصفر.
النموذجان متوفران عبر واجهة Claude API، بالإضافة إلى منصتي Amazon Bedrock، وGoogle Cloud Vertex AI، ويمكن الوصول إلى Claude Opus 4 عبر خطط الاشتراك المدفوعة (Pro، Max، Team، Enterprise)، فيما يتاح Sonnet 4 أيضاً للاستخدام المجاني.
يبلغ سعر Opus 4 نحو 15 دولاراً لكل مليون token من المدخلات، و75 دولاراً لكل مليون من المخرجات، بينما يُسعّر Sonnet 4 بنحو 3 دولارات و15 دولاراً على التوالي.
Claude Code
إلى جانب النماذج الجديدة، أعلنت الشركة عن الإطلاق الرسمي لأداة Claude Code، وهي أداة برمجية تتيح تنفيذ المهام داخل بيئات التطوير المختلفة، مثل Visual Studio Code، وJetBrains، وتدعم العمل في الخلفية عبر GitHub Actions، ما يوفر بيئة تكاملية سلسة للمطورين.
كما أطلقت الشركة مجموعة من الأدوات البرمجية الجديدة عبر Claude API، تشمل أداة تنفيذ الشيفرات، وموصل MCP، وواجهة API للملفات، وخاصية التخزين المؤقت للنصوص.