حذّر فريق من الباحثين في مجال علوم الحاسوب من شكل ناشئ من أساليب المراقبة يُعرف باسم Wireless-Tap (التنصت اللاسلكي)، يمكنه التقاط المحادثات "عن بُعد" من خلال الاهتزازات الدقيقة التي تصدرها سماعة الهاتف أثناء المكالمات.
ووفقاً للدراسة، التي نُشرت في مؤتمر WiSec 2025 للجمعية الدولية للحوسبة ACM، بشأن الأمن والخصوصية في الشبكات اللاسلكية والمتحركة، استطاع الباحثون استخدام مستشعر رادار يعمل بـ"الموجات المليمترية" لالتقاط اهتزازات الهاتف خلال المكالمات، وتحويلها إلى نصوص مفهومة، وذلك من مسافة تصل إلى 3 أمتار تقريباً.
ورغم أن دقة التقنية في نسختها الحالية لا تتجاوز 60% عند التعامل مع مفردات يصل عددها إلى 10 آلاف كلمة، إلا أن الفريق البحثي أكد أن هذه النسبة كافية لإثارة مخاوف بشأن مخاطر الخصوصية في المستقبل، إذ يمكن أن تُستغل لالتقاط كلمات رئيسية أو أجزاء من المحادثة.
وتعد هذه الدراسة امتداداً لمشروع سابق نُفذ عام 2022، حيث تمكن الفريق حينها من التعرف على 10 كلمات وأرقام وحروف محددة باستخدام رادار، وبرمجيات للتعرف على الصوت بدقة وصلت إلى 83%.
أسلوب مبتكر
الباحث الرئيسي في الدراسة، سورياودي بساك، قال: "عندما نتحدث عبر الهاتف، نميل إلى تجاهل الاهتزازات التي تنتقل عبر سماعة الأذن وتتسبب في اهتزاز الجهاز بأكمله. إذا التقطنا هذه الاهتزازات باستخدام رادارات عن بُعد، ثم أدخلناها إلى أنظمة تعلم آلي قادرة على تفسير السياق، يمكننا تحديد ما يقال وتحويله إلى نصوص".
وأضاف بساك أن "الهدف من البحث هو فهم الإمكانيات التقنية الممكنة، وتنبيه الجمهور للمخاطر المحتملة".
وبالتعاون مع المشرف على البحث، الأستاذ المشارك في علوم وهندسة الحاسوب، ماهانث جودا، استخدم الفريق مستشعر رادار بالموجات المليمترية، وهي التقنية نفسها المستخدمة في السيارات ذاتية القيادة، وشبكات الجيل الخامس، في دراسة إمكانية تطوير أجهزة مدمجة صغيرة الحجم يمكن وضعها في أدوات يومية مثل الأقلام.
وأكد الباحثون أن التجربة أُجريت لأغراض بحثية بحتة، تحسباً لما قد يطوره أشخاص أو جهات خبيثة في المستقبل.
نموذج Whisper
لتفسير البيانات الملتقطة، عدّل الفريق نموذج Whisper مفتوح المصدر، للتعرف على الكلام والمدعوم بالذكاء الاصطناعي، بهدف جعله قادراً على فهم بيانات الرادار "المشوَّشة" منخفضة الجودة.
وبدلاً من إعادة تدريب النموذج بالكامل، استخدم الباحثون تقنية تُعرف باسم "التكيف منخفض الرتبة" (Low-Rank Adaptation)، التي تتيح إعادة تدريب 1% فقط من معاملات النموذج ليتكيف مع بيانات الرادار.
عملياً، وضع الباحثون مستشعر الرادار على مسافة أمتار من الهاتف، لالتقاط الاهتزازات السطحية الدقيقة أثناء تشغيل الصوت عبر سماعة الهاتف، ثم تم إدخال الإشارة المستخلصة من الرادار إلى نسخة معدّلة من نموذج Whisper، ما أسفر عن نسبة دقة وصلت إلى 60%.
وأشار الباحثون إلى أن هذه النسبة يمكن تحسينها من خلال تصحيحات يدوية تعتمد على السياق، مثل تعديل كلمات أو عبارات معينة عند توفر معرفة مسبقة بسياق المكالمة.
وقال جودا: "النتيجة كانت نصوصاً تمثل المحادثات، مع توقع وجود بعض الأخطاء، لكن هذا يُعد تحسناً كبيراً مقارنةً بنسخة عام 2022، التي كانت تنتج بضع كلمات فقط.. وحتى التعرف الجزئي على كلمات رئيسية قد يكون مفيداً في سياقات أمنية".
وشبّه الفريق البحثي قدرات النموذج بعملية قراءة الشفاه، حيث توفر الأخيرة نسبة دقة تتراوح بين 30% و40% من الكلمات المنطوقة، إلا أن القارئين يستخدمون النماذج السياقية لفهم المحادثة.
وأوضح بساك: "كما يمكن لقارئي الشفاه تفسير المحادثات استناداً إلى سياق محدود، فإن مخرجات النموذج الجديد، إذا جُمعت مع معلومات سياقية، يمكن أن تسمح باستخلاص أجزاء من المكالمة الهاتفية من مسافة بضعة أمتار".
وأضاف: "هدفنا كان دراسة إمكانية استخدام هذه الأدوات من قبل جهات خبيثة للتنصت على المكالمات الهاتفية عن بُعد.. نتائجنا تشير إلى أن ذلك ممكن من الناحية التقنية في ظروف معينة، ونأمل أن يسهم ذلك في رفع وعي الناس ليكونوا أكثر حذراً أثناء إجرائهم للمكالمات الحساسة".