طور باحثون بشركة أبل نموذجاً للذكاء الاصطناعي، قادر على فهم سياق المحادثات مع المستخدم بدقة، إلى جانب فهم محتوى الصور ولقطات الشاشة، والإجابة عن تساؤلات المستخدم فيما يتعلق بمحتواها بشكل سليم.
وبحسب الورقة البحثية التي تناولت النموذج الجديد، فإن النموذج الجديد، والذي يحمل اسم ReaLM، مُدرب ليكون قادراً على فهم أوامر المستخدم وتساؤلاته، وكذلك السياق العام للحوار، إلى جانب سياق كل سؤال، في حال تغير مع تغير الأسئلة، وذلك يحدث عندما يتفرع المستخدم في أسئلته إلى جوانب مختلفة تحت نفس الموضوع، أو موضوعات مختلفة بالكامل.
ويتيح النموذج الجديد أيضاً، إمكانية تحليل وفهم طبيعة الصور ولقطات الشاشة المُدخلة إليه، إلى جانب إمكانية الاستعانة به مباشرة لفهم ما يظهر على شاشة جهاز المستخدم، وتقديم المساعدة ببيانات وإجابات بشأن ما يصعب على المستخدم فهمه، أو يحاول الحصول على معلومات أكثر عنه.
ويعتبر نموذج ReaLM هو الطبقة الذكية التي قد تضيفها أبل إلى مساعدها الصوتي الذكي Siri، ليكون أكثر قدرة على تنفيذ أوامر مستخدمي هواتف "آيفون"، في إطار جهود الشركة لتطويره بشكل أفضل، ليصبح أكثر عملية.
باحثو أبل، طوروا 4 إصدارات من النموذج الجديد، تتفاوت في الإمكانيات والقدرات، إلى جانب طبيعة الاستخدامات المخصصة لها.
والإصدارات الأربعة هي ReaLM-80M، وهو إصدار مكون من 80 مليون متغير، وReaLM-250M المكون من 250 مليون متغير، بينما الإصدارين الآخرين هما ReaLM-1B وReaLM-3B، ومكونان من مليار متغير و3 مليارات متغير على الترتيب.
ويقدم أضعف إصدار من النموذج الجديد، أداءً فائقاً يضاهي إمكانيات نموذج GPT-4 الأحدث، المطور من جانب شركة OpenAI، مطورة منصة الدردشة الذكية ChatGPT، والمكون من 1.76 مليار متغير، وذلك يعكس مدى التطور الذي حققه باحثو أبل.
والمتغير Parameter هو أحد أهم مكونات نماذج الذكاء الاصطناعي، ويتمثل في نوع من البيانات التي يجمعها نموذج الذكاء الاصطناعي خلال عملية تدريبه، والتي تساعده عند تشغيله على التعامل مع البيانات التي يدخلها المستخدم إليه، وتمكنه من معالجتها بشكل سليم والخروج منها بقرارات أو مخرجات مفيدة.
فعلى سبيل المثال، عندما يتدرب النموذج على صور لدببة بأشكال مختلفة، فإن المتغيرات في هذا الحالة تكون في صورة المواصفات الشكلية لأنواع الدببة المختلفة، لذلك فعندما يتم تشغيل النموذج، ويقوم المستخدم بإدخال صورة لدب باندا، فإن النموذج يكون بإمكانه فهم أن هذا الكائن هو دب، من المواصفات العامة لشكله.
ومن المقرر أن تكشف أبل خلال مؤتمرها السنوي للمطورين WWDC 2024 في 10 يونيو المقبل، عن مجموعة أدوات جديدة لمطوري التطبيقات والخدمات الرقمية المعتمدة على الذكاء الاصطناعي، إلى جانب الكشف عن عدد من المزايا الجديدة على متن إصدارات أنظمة تشغيل أجهزتها الجديدة.