تشهد عمليات الاحتيال عبر المكالمات الهاتفية بأصوات مزيفة، تزايداً ملحوظاً في الولايات المتحدة، من خلال استخدام المحتالين لأنظمة إنشاء المقاطع الصوتية باستخدام أصوات مطورة بالذكاء الاصطناعي، كي يتمكنوا من خداع الأشخاص بأن أحد المقربين منهم في محنة ويحتاج إلى مساعدة مالية عاجلة.
وأشار تقرير لصحيفة "واشنطن بوست" الأميركية إلى أن سيناريو الاحتيال يسير بنفس الطريقة تقريباً، إذ يستقبل الضحية مكالمة هاتفية من صوت يتشابه بشكل أقرب للتطابق مع صوت صديق أو أحد أفراد العائلة، ويبدأ في طلب مساعدة عاجلة بشأن موقف حرج، ما يضع الضحية تحت ضغط شديد لتندفع من دون تفكير نحو المسارعة بتحويل الأموال، وحينها تقع في مصيدة الاحتيال.
وأشار التقرير إلى أن المحتالين يستخدمون تفكيرهم الإجرامي لاختلاق مواقف صعبة تدفع الضحايا، خصوصاً كبار السن، نحو تحويل الأموال بأقصى سرعة. فعلى سبيل المثال، استقبلت روث كارد، 73 عاماً، محادثة هاتفية من صوت يتطابق مع صوت حفيدها الأكبر "براندون"، يقول إنه في السجن، وليس معه محفظته ويحتاج إلى غرامة مالية أكثر من 2000 دولار.
وبالفعل سارعت كارد إلى أحد المصارف وسحبت الحد اليومي الأقصى للسحب، وذهبت مسرعة إلى فرع آخر، ولكن حينها استدعاها مدير الفرع ليفهم مشكلة رغبتها في سحب هذا المبلغ الكبير، عندها شرحت الموقف، فقال لها إن عميل آخر لدى البنك تعرض لنفس الموقف وكانت عملية احتيال، حينها شككت بأن الصوت لم يكن لحفيدها من الأساس.
"تطور مفزع"
ووصف البروفيسور هاني فريد، الخبير في مجال التحليل الجنائي الرقمي وعميد ورئيس المدرسة لكلية المعلومات بجامعة كاليفورنيا في بيركلي، التطور الذي تشهده تقنيات الذكاء الاصطناعي التوليدي Generative AI بـ"تطور مفزع".
وأوضح فريد للصحيفة أن الأنظمة الذكية لإنشاء النسخ الرقمية من الأصوات البشرية قد شهدت تطوراً كبيراً خلال الفترة الأخيرة، ففي السابق كانت تحتاج إلى كم كبير من التسجيلات الصوتية للشخص كي تتمكن من إنشاء نسخ رقمية دقيقة لصوته، ولكن الآن تطورها جعلها تكتفي بمقطع صوتي 30 ثانية فقط للمستخدم كي تنشئ نسخة افتراضية دقيقة تطابق صوته.
وأكد خبير التحليل الجنائي الرقمي أن المقطع الصوتي لمدة 30 ثانية؛ يمكن أن يتم الحصول عليه من أي فيديو متداول على الشبكات الاجتماعية من يوتيوب وتيك توك وفيسبوك وانستجرام، أو العروض الصوتية Podcasts.
متاعب "صوتية"
وأحدثت منصات إنشاء المقاطع الصوتية بالذكاء الاصطناعي متاعب على مستويات مختلفة خلال الفترة الماضية، وكان أشهرها منصة ElevenLabs، والتي تسمح لمستخدميها إنشاء مقاطع صوتية بأي صوت يرغبون فيه، من خلال رفع عدد من المقاطع الصوتية للشخص المطلوب استخدام صوته، حتى وإن كان ذلك الشخص لا يستخدم الخدمة.
وتتيح المنصة الناشئة إنشاء المقاطع الصوتية بشكل مجاني، ولكن وضع عدد محدود من المقاطع المتاحة، ولكي يتمكن المستخدم من زيادة عدد المقاطع التي يمكنه إنشائها، يستطيع دفع اشتراك شهري تبدأ قيمته من 5 دولارات.
وبحسب سلسلة تغريدات نشرتها المنصة على تويتر، أشارت "إيليفين لابس" إلى أنها وضعت بعض التدابير الأمنية لحماية خدمتها من الاستغلال السيء من جانب العناصر الإجرامية، مثل إنشاء أداة برمجية تسمح بالتأكد من مدى مصداقية التسجيلات الصوتية.