
تعمل شركة جوجل على تطوير جيل جديد من واجهات الاستخدام المدعومة بالذكاء الاصطناعي، يستهدف تحويل مؤشر الفأرة التقليدي إلى أداة ذكية قادرة على فهم العناصر التي يشير إليها المستخدم، والسياق المرتبط بها، وحتى النية الكامنة وراء التفاعل، وذلك بالاعتماد على قدرات نموذج جيميناي Gemini.
وقالت الشركة، في بيان صادر عن قطاع الذكاء الاصطناعي Google DeepMind، إن مؤشر الفأرة "الماوس" ظل لعقود جزءاً أساسياً من تجربة استخدام الحواسيب، سواء في تصفح الإنترنت أو تحرير المستندات أو أداء المهام اليومية المختلفة، إلا أن آلية عمله بقيت إلى حد كبير دون تغييرات جوهرية منذ أكثر من 50 عاماً، رغم التطورات الكبيرة التي شهدتها تقنيات الحوسبة وواجهات الاستخدام.
"ماوس" ذكي
وأوضحت جوجل أنها تستكشف حالياً إمكانات جديدة مدعومة بالذكاء الاصطناعي قد تمنح مؤشر الفأرة "الماوس" دوراً يتجاوز وظيفته التقليدية القائمة على التحديد والنقر، ليصبح قادراً على فهم ما يشير إليه المستخدم ولماذا يهمه ذلك.
وترى الشركة أن من أبرز التحديات الحالية أن أدوات الذكاء الاصطناعي تعمل غالباً داخل تطبيقات أو نوافذ منفصلة، ما يضطر المستخدمين إلى نقل المحتوى أو السياق يدوياً من بيئة العمل الأساسية إلى أدوات الذكاء الاصطناعي، الأمر الذي يحد من سلاسة الاستخدام، ويعطل سير العمل.
وأضافت أن هذا الأسلوب يقطع تدفق العمل الطبيعي، ويجبر المستخدم على إجراء ما وصفته بـ"التنقلات القسرية: بين التطبيقات المختلفة.
وفي المقابل، تسعى جوجل إلى تطوير تجربة مختلفة تماماً، تقوم على وجود الذكاء الاصطناعي داخل جميع الأدوات التي يستخدمها الشخص بالفعل، بحيث يتمكن من التفاعل معه بصورة طبيعية وسلسة دون مغادرة التطبيق أو الصفحة التي يعمل عليها.
وضربت الشركة مثالاً على ذلك بالإشارة إلى صورة مبنى وطلب "أرني الاتجاهات Show Me Directions"، موضحة أن النظام الذكي سيكون قادراً تلقائياً على فهم الصورة وسياق الطلب والمقصود منه، دون الحاجة إلى شرح إضافي أو كتابة أوامر تفصيلية.
مؤشر "يفهم" و"يسمع"
وكشفت جوجل عن بيئة تجريبية لمؤشر مدعوم بالذكاء الاصطناعي معزز بقدرات جيميناي Gemini، يتيح للمستخدمين تنفيذ مهام متنوعة بمجرد الإشارة والتحدث.
وأوضحت الشركة أن المستخدم يمكنه، على سبيل المثال، الدخول إلى جوجل AI Studio لتحرير صورة، أو البحث عن أماكن على الخرائط، فقط عبر توجيه المؤشر واستخدام الأوامر الصوتية، دون الحاجة إلى التنقل بين القوائم أو كتابة أوامر مطولة.
وأشارت إلى أن مقاطع الفيديو التي عرضتها للشكل التجريبي الجديد جرى اختصارها زمنياً لتوضيح الفكرة بصورة أسرع.
وذكرت جوجل أنها طورت 4 مبادئ أساسية تقود رؤيتها المستقبلية لواجهات الاستخدام المدعومة بالذكاء الاصطناعي، وتهدف هذه المبادئ مجتمعة إلى نقل عبء توضيح السياق والنية من المستخدم إلى الحاسوب، بحيث تصبح التفاعلات أبسط وأكثر طبيعية، مع تقليل الاعتماد على الأوامر النصية الطويلة.
الحفاظ على سير العمل
أكدت الشركة أن قدرات الذكاء الاصطناعي يجب أن تعمل عبر جميع التطبيقات، بدلاً من إجبار المستخدم على الانتقال إلى مساحات مخصصة للتفاعل مع الذكاء الاصطناعي مثل تطبيق ما أو موقع ويب معين.
وفي النموذج الأولي الذي تطوره جوجل، يظهر المؤشر الذكي داخل أي مساحة يعمل عليها المستخدم، فعلى سبيل المثال، يمكن للمستخدم الإشارة إلى ملف PDF وطلب إنشاء ملخص مختصر في نقاط، ليتم إدراجه مباشرة داخل رسالة بريد إلكتروني.
كما يستطيع تمرير المؤشر فوق جدول إحصائي وطلب تحويله إلى مخطط دائري، أو تحديد وصفة طعام وطلب مضاعفة جميع المكونات تلقائياً.
أوامر سياقية
أوضحت جوجل أن نماذج الذكاء الاصطناعي الحالية تعتمد بشكل كبير على كتابة أوامر دقيقة ومفصلة للحصول على نتائج جيدة، ما يفرض على المستخدم التفكير في كيفية صياغة الطلب بدقة.
لكن المؤشر المدعوم بالذكاء الاصطناعي، بحسب الشركة، يهدف إلى تبسيط هذه العملية عبر التقاط السياق البصري والدلالي المحيط بالمؤشر بصورة سلسة، بحيث يتمكن الحاسوب من “رؤية” وفهم ما يعتبره المستخدم مهماً.
وفي النظام التجريبي، يكفي أن يشير المستخدم إلى عنصر معين، ليصبح الذكاء الاصطناعي قادراً على تحديد الكلمة أو الفقرة أو الجزء المطلوب من الصورة أو حتى مقطع الشيفرة البرمجية الذي يحتاج المستخدم إلى المساعدة بشأنه.
فهم الإيماءات
ترى جوجل أن البشر في تفاعلاتهم اليومية لا يعتمدون غالباً على جمل طويلة ومفصلة، بل يستخدمون عبارات مختصرة مثل "أصلح هذا"، أو "انقل ذلك هنا"، أو "ماذا يعني هذا؟"، مع الاعتماد على الإشارات الجسدية والسياق المشترك لفهم المقصود.
وقالت الشركة إن تطوير نظام ذكاء اصطناعي قادر على فهم هذا المزيج من السياق والأوامر النصية والإيماءات، سيسمح للمستخدمين بتنفيذ طلبات معقدة باستخدام اختصارات لغوية طبيعية، دون الحاجة إلى كتابة أوامر دقيقة أو معقدة.
تحويل البكسلات إلى عناصر قابلة للتفاعل
أشارت جوجل إلى أن الحواسيب اكتفت لعقود بتتبع موقع مؤشر الفأرة فحسب، في حين بات الذكاء الاصطناعي اليوم قادراً على فهم طبيعة العنصر الذي يشير إليه المستخدم والتفاعل معه بصورة أكثر إدراكاً للسياق.
وقالت إن هذه القدرة تسمح بتحويل العناصر المرئية إلى كيانات منظمة وقابلة للتفاعل الفوري، مثل الأماكن والتواريخ والأشياء المختلفة.
وضربت الشركة أمثلة متعددة على ذلك، منها إمكانية تحويل صورة لملاحظة مكتوبة بخط اليد إلى قائمة مهام تفاعلية، أو تحويل لقطة متوقفة من فيديو سفر إلى رابط حجز مباشر لمطعم ظهر داخل الفيديو.
واجهات تتكيف مع البشر
وأكدت جوجل أن بناء تقنيات تتكيف مع السلوك البشري، بدلاً من إجبار المستخدمين على التكيف مع التكنولوجيا، يفتح الباب أمام مستقبل يصبح فيه التعاون مع الذكاء الاصطناعي عند استخدام الحواسيب أكثر سلاسة وطبيعية وانسيابية.
وأضافت الشركة أنها متحمسة لرؤية هذه المفاهيم "المحورية حول الإنسان" وهي تُدمج تدريجياً داخل المنتجات اليومية التي يستخدمها الملايين.
وكشفت جوجل أنها بدأت بالفعل تطبيق هذه المبادئ لإعادة تصور طريقة استخدام المؤشر داخل متصفح كروم، وكذلك ضمن تجربة الحواسيب المحمولة الجديدة "جوجل بوك Google Book".
واعتباراً من الآن، أصبح بإمكان المستخدمين استخدام المؤشر داخل كروم لطرح أسئلة على جيميناي Gemini تتعلق بجزء محدد من صفحة الويب، بدلاً من كتابة أوامر نصية معقدة.
وأوضحت الشركة أن المستخدم يستطيع، على سبيل المثال، تحديد عدة منتجات داخل صفحة تسوق وطلب مقارنة بينها، أو الإشارة إلى مساحة معينة داخل غرفة المعيشة لعرض تصور افتراضي لأريكة جديدة في ذلك المكان.
كما أعلنت جوجل أنها تعتزم قريباً إطلاق ميزة (Magic Pointer) ضمن عائلة حواسيبها الشخصية الجديدة جوجل بوك، والتي ستتيح للمستخدمين الوصول إلى قدرات جيميناي مباشرة من خلال المؤشر، بهدف توفير تجربة أكثر سهولة وبديهية.
وأضافت الشركة أن هناك العديد من الاستخدامات المحتملة الأخرى لهذه المفاهيم، مؤكدة أنها ستواصل اختبار أفكار وتجارب مستقبلية عبر منصاتها المختلفة، بما في ذلك مشروع Google Labs المعروف باسم Disco.
يُذكر أن المؤشر الذكي الجديد المعزز بقدرات جيميناي قد كشفت عنه جوجل في مؤتمرها السنوي لأندرويد The Android Show 2026، وذلك قبيل أسبوع من عقد مؤتمرها السنوي للمطورين IO 2026، والمقرر إقامته خلال يومي 19 و20 من مايو الجاري.








