اعترفت شركة جوجل الأميركية، بصحة واقعة تسريب 2500 مستند يتناول آليات ترتيب نتائج عمليات البحث داخل محركها "Google Search"، ولم توضح الشركة حجم البيانات "المسربة" والمستخدمة حالياً في نظام البحث.
وبحسب بيانٍ رسمي لموقع ذا فيرج، أكد دافيس طومسون، المتحدث باسم جوجل، أن الشركة تحذر من "وضع افتراضات حول آلية عمل البحث استناداً إلى معلومات غير دقيقة أو مجتزئة أو قديمة".
وسلّط مؤسس موقع SparkToro، راند فيشكن، الضوء على أزمة التسريب، بعدما تواصل معه عرفان آزيمي، الموظف السابق في جوجل، والممارس لعلم تهيئة مواقع الويب SEO.
وتتعارض المعلومات الواردة في "المستندات المسرّبة"، مع تصريحات المتحدثين باسم جوجل حول طريقة عمل محركها للبحث، خاصة المتعلقة بفكرة عدم تأثير عدد المستخدمين على نتائج البحث على ترتيب النتائج.
نظام NavBoost
وكشفت "أزمة التسريب" أن عملاق البحث "جوجل" عمل على تطوير نظام داخلي يُعرف باسم NavBoost، يعتمد على جمع بيانات من جلسات البحث الخاصة بالمستخدم، والروابط التي يضغط عليها، ويزور المواقع من خلالها، وهو ما يعرف باسم Clickstream Data.
والنظام الذي جرى تطويره قبل عام 2005، هو المحرك الرئيسي وراء إطلاق جوجل لمتصفحها الخاص Google Chrome في 2008.
ويجمع نظام "NavBoost" عمليات البحث التي تجري حول كلمة مفتاحية معينة، لتحديد الكلمات المفتاحية الرائجة Trending Search demand، وكذلك عدد مرات الضغط على نتيجة معينة من نتائج البحث.
كما يقيس ويقارن بين جلسات البحث وجودتها عندما يقوم المستخدم بالضغط على عدد كبير من الروابط بعد البحث أو عدد قليل منها.
وطورت جوجل من نظام NavBoost، ليفهم العديد من أشكال البيانات، مثل الدولة التي ينتمي إليها المستخدم، والجهاز الذي يستخدمه للبحث إن كان حاسوباً أو هاتفاً ذكياً، ويؤثر في طبيعة ترتيب نتائج البحث أمام المستخدم.
Google Chrome
وجاء في "الوثائق المسرّبة" أن شركة جوجل كانت ترغب خلال عام 2005 في جمع معلومات دقيقة حول من روابط المواقع، التي يُجرى زيارتها من خلال أي متصفح للإنترنت حول العالم، لتتمكن من تحسين جودة نتائج البحث الخاصة بمحركها.
وحققت جوجل ذلك مع إطلاق متصفحها Google Chrome، والذي سمح لها بجمع كم ضخم من البيانات التي تعزز من دقة مقاييسها لحساب مدى أهمية صفحات الويب، وكذلك موثوقية ومصداقية المواقع الإلكترونية نفسها، بالاعتماد في الأساس على ضغط المستخدم على روابط نتائج البحث.
ومن خلال تتبع طبيعة صفحات الويب على موقع ما، وحجم الزيارات التي تصل إليها والمدة التي يقضيها مستخدمو "جوجل كروم"، فإن "جوجل سيرش" يصبح قادراً على تحديد الصفحات الأكثر أهمية، وبالتالي يبدأ في إظهارها في ترتيب متقدم داخل نتائج البحث، بل ويتحكم أيضاً في ترتيب الصفحات الفرعية تحت اسم الموقع الرئيسي site domain عند البحث عنه.
أسرار أخرى
ووفقاً لمعلومات "أزمة التسريب"، استخدمت جوجل ملفات الارتباط Cookies المخزنة داخل متصفحها كروم، وذلك سجلات التصفح، إلى جانب عدد الروابط التي يضغط عليها المستخدم في جلساته للبحث على "جوجل سيرش"، لمواجهة الحملات اليدوية والأوتوماتيكية للضغط على الروابط Click Spam Campaigns.
كما استخدمت الشركة الأميركية طريقة جديدة لترتيب نتائج البحث أمام المستخدمين داخل محركها، حيث عملت على اختبار تفاعل المستخدمين مع نتائج البحث خلال جلسة البحث وما بعدها.
وبمثالٍ للتوضيح، "إذا قام المستخدم بالبحث عن كلمة جوجل، ولكن لم يظهر في نتائج البحث أي نتائج حول كلمة أندرويد، ومن ثم أنهى المستخدم الجلسة، وبدأ جلسة جديدة وبحث عن كلمة أندرويد، وضغط على الصفحة الرسمية لنظام التشغيل، فإن محرك بحث جوجل سيفهم أن جوجل وأندرويد كلمتان مفتاحيتان مرتبطتان، وبالتالي ستُحسن من ترتيب مواقع الويب التي تتضمن كلمة أندرويد وكذلك الموقع الرسمي له في نتائج البحث الخاصة بكلمة جوجل مستقبلًا".
وجاء في "المستندات المسربة" أن شركة جوجل خلال فترات الأزمات والطوارئ والأحداث السياسية المهمة، تنشئ قائمة بيضاء للمواقع المصرح لها بالظهور في صدارة نتائج البحث، وتطبق تلك السياسة خلال جائحة كورونا، والأحداث السياسية عالمياً.