نموذج جديد من جوجل للترجمة الصوتية بدقة بين أكثر من 70 لغة | الشرق للأخبار

نموذج جديد من جوجل للترجمة الصوتية بدقة بين أكثر من 70 لغة

time reading iconدقائق القراءة - 4
نموذج جوجل الجديد للترجمة الفورية الصوتية، صورة منشأة بالذكاء الاصطناعي - Asharq
نموذج جوجل الجديد للترجمة الفورية الصوتية، صورة منشأة بالذكاء الاصطناعي - Asharq
القاهرة -

أطلقت شركة جوجل نموذجها الصوتي الجديد Gemini 3.5 Live Translate، الذي يوفّر ترجمة فورية صوتية شبه لحظية بين أكثر من 70 لغة.

وقالت الشركة، في بيان، إن النموذج الجديد صُمم لتقديم ترجمة صوتية تحافظ على نبرة المتحدث الأصلية وإيقاع الحديث وطبقة الصوت، ما يجعل المحادثات المترجمة أقرب إلى التواصل البشري الطبيعي.

ويتميّز Gemini 3.5 Live Translate بقدرته على اكتشاف اللغات تلقائياً دون حاجة إلى إعدادات يدوية، إلى جانب دعم الترجمة المستمرة أثناء الحديث، بدلاً من انتظار انتهاء المتحدث قبل بدء الترجمة كما هي الحال في الأنظمة التقليدية.

وأوضحت جوجل أن النموذج يوازن بين سرعة الاستجابة وجودة الترجمة، ما يسمح بتقديم صوت مترجم بانسيابية ودون فواصل مزعجة، مع تأخير لا يتجاوز بضع ثوانٍ فقط عن المتحدث الأصلي طوال الجلسة.

وبدأت الشركة طرح Gemini 3.5 Live Translate عبر مجموعة من خدماتها ومنتجاتها المختلفة، إذ أصبح متاحاً للمطورين ضمن مرحلة المعاينة العامة عبر Gemini Live API وGoogle AI Studio، كما يصل إلى الشركات عبر خدمة Google Meet في مرحلة المعاينة الخاصة خلال يونيو الجاري، إضافة إلى توفيره للمستخدمين من خلال تطبيق جوجل ترانسليت على نظامي Android وiOS.

وترى جوجل أن النموذج الجديد يمكن أن يفتح المجال أمام استخدامات متعددة، تشمل الترجمة الفورية للمكالمات والاجتماعات والدروس والبث المباشر، فضلاً عن دعم البيئات متعددة اللغات التي تتطلب تواصلاً لحظياً ودقيقاً.

تعاون مع تطبيقات مختلفة

وفي إطار توسيع نطاق استخدام التقنية، أشارت الشركة إلى أن منصات مثل Agora وLiveKit وPipecat وVision Agents بدأت بالفعل في دمج Gemini Live API داخل خدماتها لتسهيل تطوير تطبيقات الترجمة الصوتية الفورية، فيما تتولى تلك المنصات إدارة البنية التحتية الخاصة ببث الوسائط في الزمن الحقيقي، بما يسمح للمطورين بالتركيز على تحسين تجربة المستخدم.

اقرأ أيضاً

يوتيوب | دبلجة تلقائية بـ27 لغة.. و6 منها تحافظ على الصوت الأصلي

أعلنت منصة "يوتيوب" عن تحديث لميزة الدبلجة التلقائية المعتمدة على تقنيات الذكاء الاصطناعي Auto Dubbing.

وكشفت شركة Grab عن اختبار النموذج الجديد بهدف دعم التواصل متعدد اللغات بين السائقين والركاب أثناء عمليات التوصيل، خاصة أن مستخدمي التطبيق يجرون أكثر من 10 ملايين مكالمة صوتية شهرياً عبر المنصة.

ومن المقرر أن تبدأ الشركة طرح الميزة لعدد من عملاء Google Workspace للأعمال، خلال الشهر الجاري، قبل توسيع نطاق الإطلاق، في وقت لاحق من العام الجاري.

تجربة أفضل داخل Google Translate

وفي تطبيق Google Translate، بدأت الشركة أيضاً طرح وضع "الاستماع" الجديد لمستخدمي Android، والذي يسمح بالاستماع إلى الترجمة مباشرة عبر سماعة الهاتف الداخلية، من خلال رفع الهاتف إلى الأذن كما في المكالمات التقليدية، وهو ما تقول Google إنه يوفّر طريقة أكثر خصوصية وسرعة للاستماع إلى الترجمة، خاصة في الحالات التي لا تتوفر فيها سماعات الرأس.

وفي سياق متصل، أكدت الشركة أن جميع المقاطع الصوتية المُولدة عبر نماذجها تحمل علامات مائية رقمية باستخدام تقنية SynthID، بهدف تسهيل اكتشاف المحتوى المُنشأ بالذكاء الاصطناعي والمساعدة في الحد من التضليل المعلوماتي والمحتوى المزيف.

تصنيفات

قصص قد تهمك