كيف تفوق Claude على جامعي التبرعات المحترفين؟ دراسة تجيب

صورة مولّدة بالذكاء الاصطناعي صممتها "الشرق" للتعبير عن أداء الذكاء الاصطناعي مقارنة بالبشر في جمع التبرعات - Asharqصورة مولّدة بالذكاء الاصطناعي صممتها "الشرق" للتعبير عن أداء الذكاء الاصطناعي مقارنة بالبشر في جمع التبرعات - Asharq

القاهرة-

أظهرت دراسة بحثية جديدة أن نموذج Claude Opus 4.6 المطور من شركة أنثروبيك نجح في إقناع أشخاص بالتبرع بأموالهم بمعدل يفوق أداء جامعي التبرعات المحترفين، ما يثير تساؤلات جديدة بشأن تنامي قدرة أنظمة الذكاء الاصطناعي على الإقناع والتأثير.

وبحسب الدراسة التي أعدها باحثون من جامعة أكسفورد وعدد من المؤسسات البحثية الأخرى، فإن Claude Opus 4.6 أظهر أداءً متقدماً في مهام الإقناع مقارنة بالبشر، وهو ما يعكس التطور المتسارع لقدرات نماذج الذكاء الاصطناعي التوليدي.

كلود يجمع التبرعات

اختبر الباحثون عدداً من نماذج الذكاء الاصطناعي التجارية، وقارنوها بمجموعة من جامعي التبرعات ذوي الخبرة الذين يعملون لصالح منظمة Save the Children، بهدف قياس قدرة كل طرف على إقناع أشخاص بالتبرع بجزء من المكافأة المالية التي يحصلون عليها مقابل المشاركة في الدراسة.

وشملت التجربة أكثر من 1000 محادثة جرت بين المشاركين وكل من نماذج الذكاء الاصطناعي أو جامعي التبرعات المحترفين.

وكشفت النتائج أن نموذج Claude Opus 4.6 كان أكثر فاعلية بنحو ثلاثة أضعاف من جامعي التبرعات المحترفين في إقناع المشاركين بالتبرع بجزء من مكافآتهم.

ولم يقتصر التفوق على عدد المتبرعين فحسب، بل نجح النموذج أيضاً في الحصول على تبرعات أكبر، إذ بلغ متوسط قيمة التبرعات التي أقنع المشاركين بتقديمها أعلى بنسبة 13% مقارنة بمتوسط التبرعات التي جمعها المحترفون.

وأشار الباحثون إلى أن هذه النتائج وردت في دراسة أولية (Preprint) لم تخضع حتى الآن لمراجعة الأقران، وبالتالي فإنها لا تزال بحاجة إلى مراجعة علمية قبل اعتمادها بصورة نهائية.

اختبار آخر في المناظرات

ولم تقتصر الدراسة على قياس قدرات الذكاء الاصطناعي في جمع التبرعات، بل اختبرت أيضاً أداء النماذج في المناظرات.

وأظهرت النتائج كذلك أن Claude وعدداً من النماذج الرائدة الأخرى تفوقت على نخبة من محترفي المناظرات التنافسية، بفارق بلغ 4.6 نقطة مئوية.

لكن الباحثين لاحظوا أن هذا التفوق تراجع إلى حد كبير عندما فرضوا على أنظمة الذكاء الاصطناعي استخدام عدد كلمات يماثل تقريباً ما يستخدمه المتحدثون من البشر.

ويرى فريق الدراسة أن هذه النتيجة تشير إلى أن جزءاً مهماً من تفوق الذكاء الاصطناعي لا يعود بالضرورة إلى امتلاكه قدرات استدلالية أو منطقية أفضل، وإنما إلى قدرته على كتابة ردود مطولة، واستحضار كميات كبيرة من المعلومات والحقائق والمراجع بسرعة كبيرة، وهو ما يمنحه أفضلية في المحادثات المطولة.

رسائل أطول

ولاحظ الباحثون أن روبوتات الدردشة كتبت رسائل أطول بعدة مرات من تلك التي أعدها جامعو التبرعات المحترفون.

كما احتوت تلك الرسائل على عدد كبير من الادعاءات الواقعية والإشارات إلى خبراء ومراجع، الأمر الذي منحها قوة إضافية في الإقناع.

لكن الدراسة حذرت في الوقت نفسه من أن القدرة على الإقناع لا تعني بالضرورة صحة المعلومات.

ولفت الباحثون إلى أن بعض النماذج أنتجت أثناء التجارب معلومات بدت مقنعة للغاية، لكنها كانت غير مدعومة بأدلة كافية، أو تضمنت معلومات مختلقة أو غير دقيقة، وهو ما يعكس استمرار مشكلة "الهلوسة" التي تعاني منها نماذج الذكاء الاصطناعي التوليدي.

"لا داعي للقلق"

ورغم النتائج التي توصلت إليها الدراسة، دعا الباحثون إلى عدم المبالغة في تفسيرها أو استخلاص استنتاجات متسرعة منها.

وأوضح الباحثون أن التجارب أجريت بالكامل عبر محادثات نصية، وأن المشاركين كانوا مستعدين للدخول في نقاشات استمرت ما بين 15 و20 دقيقة، وهو سيناريو قد لا يعكس طبيعة تفاعل المستخدمين مع أنظمة الذكاء الاصطناعي في الحياة اليومية.

وأضافوا أن الدراسة لم تختبر سيناريوهات التعاون بين البشر والذكاء الاصطناعي، رغم أن هذا النموذج يُعد الأكثر ترجيحاً داخل بيئات العمل مستقبلاً، حيث من المتوقع أن يعمل الطرفان معاً بدلاً من أن يحل أحدهما مكان الآخر.

ويرى الباحثون أيضاً أن الجانب الأكثر إثارة للقلق لا يتعلق بقدرة الذكاء الاصطناعي على جمع التبرعات، وإنما بما قد تمثله هذه النتائج من مؤشر على تطور قدرات النماذج في التأثير على البشر.

فإذا كانت أنظمة الذكاء الاصطناعي تستطيع اليوم إقناع الأشخاص بالتبرع بأموال أكثر مقارنة بجامعي التبرعات المدربين، فقد تصبح قادرة غداً على التأثير بالفاعلية نفسها في قرارات الشراء، أو تشكيل المواقف السياسية، أو توجيه النقاشات العامة وصناعة الرأي العام.

ويشير ذلك، وفق الدراسة، إلى أن التطور المستمر في قدرات الإقناع لدى نماذج الذكاء الاصطناعي يمثّل فرصة كبيرة لتعزيز الإنتاجية في العديد من المجالات، لكن في الوقت نفسه يبرز الحاجة إلى تعزيز الشفافية، ووضع ضوابط واضحة تحكم المحتوى الذي تنتجه هذه الأنظمة، بما يضمن عدم استغلالها للتأثير في المستخدمين أو توجيههم بطرق غير معلنة.

تصنيفات

تكنولوجياالذكاء الاصطناعيالولايات المتحدة