Dynamo من "إنفيديا" ترفع قدرة النماذج الذكية على "التفكير" بتكلفة أقل

time reading iconدقائق القراءة - 5
رسم توضيحي لمنصة NVIDIA Dynamo الجديدة لدعم أداء نماذج الاستدلال الذكية بتكلفة أقل - NVIDIA
رسم توضيحي لمنصة NVIDIA Dynamo الجديدة لدعم أداء نماذج الاستدلال الذكية بتكلفة أقل - NVIDIA
القاهرة-محمد عادل

كشفت شركة "إنفيديا" (NVIDIA) عن منصتها الجديدة NVIDIA Dynamo، والتي تأتي خليفة لمنصة Triton Inference Server، لتقديم تحسينات هائلة في خدمات الاستدلال عبر نماذج الذكاء الاصطناعي AI Inference، وتعزيز كفاءة النماذج الذكية المفكرة Reasoning Models.

وصممت "إنفيديا" المنصة الجديدة لتعزيز العائد على الاستثمار في المصانع الذكية للذكاء الاصطناعي عبر تحسين إدارة عمليات الاستدلال وتوزيعها بكفاءة على الآلاف من بطاقات معالجة الرسوميات، مما سيرفع من الأداء وسرعة تجربة المستخدمين، وسيخفض النفقات ويعظّم من عوائد مقدمي الخدمات، بحسب بيانٍ رسمي للشركة.

وتُمثّل NVIDIA Dynamo نقلة نوعية في طريقة التعامل مع نماذج الذكاء الاصطناعي الكبيرة من خلال اتباع نهج جديد وهو "الخدمة المفككة" Disaggregated Serving، والذي يعتمد على فصل مرحلتَي المعالجة والفهم عن توليد الاستجابات لتساؤلات المستخدم، وتوزيعهما على وحدات معالجة رسومية مختلفة.

ويتيح هذا النهج تحسين أداء كل مرحلة بشكل مستقل، مما يزيد من كفاءة استخدام موارد بطاقات الرسوميات، ويقلل من تكاليف الحوسبة.

أداء غير مسبوق

وقال جين-سون هوانج الرئيس التنفيذي لشركة إنفيديا: "تدرب الشركات حول العالم نماذج الذكاء الاصطناعي لتصبح أكثر تطوراً في التفكير والاستنتاج بمرور الوقت. ولضمان مستقبل يعتمد على الذكاء الاصطناعي المفكر، تساعد NVIDIA Dynamo في نشر هذه النماذج على نطاق واسع، مما يوفر كفاءة أكبر وتوفيراً في التكاليف داخل مصانع الذكاء الاصطناعي".

وبفضل المنصة الجديدة ستحقق الشركات من خلال نماذجها الذكية ضعف الأداء والعائد من عدد وحدات معالجات الرسوميات نفسه، وذلك عند تشغيل نماذج قائمة على معمارية Llama مفتوحة المصدر على منصة إنفيديا للمعالجات Nvidia Hopper.

وأشارت الشركة إلى أن تشغيل نموذج DeepSeek-R1 باستخدام منصة إنفيديا GB200 NVL72 باستخدام NVIDIA Dynamo، سيعزز عدد الرموز النصية  "توكنز" التي يتم توليدها بمعدل 30 ضعفاً لكل بطاقة معالجة للرسوميات، بفضل التحسينات الذكية في عمليات الاستدلال.

وتعتمد المنصة على مجموعة من التقنيات المبتكرة لزيادة كفاءة عمليات الاستدلال وخفض التكاليف التشغيلية.

كما توفر إدارة ديناميكية لوحدات معالجة الرسوميات، حيث يمكنها إضافة أو إزالة أو إعادة تخصيص المعالجات تلقائياً استجابة لطبيعة الاستفسارات والطلبات التي يوجهها المستخدم للنموذج الذكي.

كما تتيح إمكانية تحديد أفضل معالجات الرسوميات من حيث الأداء داخل الشبكات الضخمة لمعالجة الطلبات بأقل استهلاك للحوسبة، مما يقلل من وقت الاستجابة، ويحافظ على سلاسة تجربة المستخدم.

علاوة على ذلك، تقدم منصة NVIDIA Dynamo الجديدة قدرة فائقة على توصيل بيانات الاستدلال إلى وحدات تخزين وذاكرة أرخص داخل شبكات المعالجات الضخمة، مع استعادتها بسرعة عند الحاجة، مما يخفض التكاليف دون التأثير على الأداء.

التقنيات الرئيسية وراء المنصة

تعتمد منصة NVIDIA Dynamo على 4 تقنيات رئيسية تقلل تكاليف خدمة الاستدلال، وتحسن تجربة المستخدم، وتتمثل في مخطط وحدات GPU Planner، وهو عبارة عن محرك تخطيط ديناميكي يضيف أو يزيل وحدات لمعالجة الرسوميات حسب الحاجة، مما يضمن عدم وجود فائض أو نقص في الاستخدام.

وتعتمد المنصة كذلك على نظام التوجيه الذكي Smart Router، والذي يستخدم الذكاء الاصطناعي ليقلل العمليات الحسابية المتكررة عن طريق إعادة توجيه الطلبات إلى الوحدات التي تمتلك بيانات مسبقة مشابهة، مما يسرّع الاستجابة.

ووضعت إنفيديا داخل نظامها الجديد مكتبة الاتصال ذات وقت الاستجابة المنخفض (Low Latency Communication Library)، وهي مخصصة لتسريع تبادل البيانات بين وحدات المعالجة المختلفة، مما يحسن سرعة المعالجة.

ثم يأتي دور مدير الذاكرة (Memory Manager)، والذي يعمل بمثابة محرك إدارة ذاكرة يقوم بتخزين بيانات الاستدلال في ذاكرات منخفضة التكلفة واستعادتها عند الحاجة دون التأثير على الأداء.

دعم واسع

تتوفر منصة NVIDIA Dynamo كمشروع مفتوح المصدر، مما يتيح استخدامها وتخصيصها من قِبَل المطورين والشركات الناشئة، وهي تدعم منصات التطوير المختلفة مثل PyTorch، وSGLang، وNVIDIA TensorRT™-LLM، وvLLM، مما يسهل على المؤسسات البحثية والشركات دمجها في أنظمتها لخدمة الذكاء الاصطناعي.

كما سيتم اعتماد NVIDIA Dynamo من قِبَل عدد من خدمات الشركات الكبرى السحابية الداعمة لتدريب نماذج الذكاء الاصطناعي، مثل AWS، Cohere، CoreWeave، Dell، Google Cloud، Lambda، Meta، Microsoft Azure، Nebius، NetApp، OCI، Perplexity، Together AI وVAST، مما يعزز انتشارها في مختلف بيئات الحوسبة السحابية.

يُذكر أنه سيتم دمج NVIDIA Dynamo في خدمات NVIDIA NIM™ microservices، كما سيتم دعمها في الإصدارات المستقبلية من منصة NVIDIA AI Enterprise، مما يضمن مستوى عالٍ من الأمان والاستقرار والدعم الفني.

تصنيفات

قصص قد تهمك