المنتج الذي أعلنت عنه NVIDIA وهو GB200 NVL72، ليس مجرد وحدة معالجة رسومات عالية الأداء، بل غيّر جذرياً طريقة بناء شبكات GPU بين عدة أجهزة. في السابق، كانت هناك حاجة لإعدادات معقدة يدوية، أما الآن فبات نظام Kubernetes (نظام إدارة الحاويات) يتولى الأمر بشكل شبه تلقائي.
ما هو ComputeDomains؟
ببساطة، هو آلية لربط وحدات GPU الموزعة عبر عدة خوادم بشكل “آمن” و"سريع". تم دمجه في برنامج تشغيل NVIDIA DRA GPU، حيث يتم إنشاء وإدارة مناطق وصول الذاكرة تلقائياً كلما تم جدولة عبء عمل (عملية حسابية). كما تم تعزيز الفصل الأمني والقدرة على التحمل ضد الأعطال.
فوائد التنفيذ
القابلية للتوسع: يصبح الرف بالكامل شبكة GPU موحدة، متجاوزاً حدود عصر النود الواحد
الإدارة الديناميكية: كل عبء عمل يحصل على نطاق مستقل، مما يزيد من كفاءة استخدام الموارد بشكل كبير
دعم تعدد المستأجرين: يمكن تنفيذ عمليات عدة مستخدمين في نفس الوقت دون أي تداخل
الخلفية: تطور الحوسبة باستخدام GPU
أنظمة NVIDIA DGX القديمة كانت تتوقف عند التوسع داخل جهاز واحد فقط. بعد ظهور NVLink متعدد العقد (MNNVL)، أصبحت اتصالات GPU بين الخوادم المختلفة فائقة السرعة. ComputeDomains الآن هو تنفيذ لهذه التقنية بشكل أصيل على Kubernetes. أصبحت البنية التحتية لتدريب نماذج اللغة الضخمة والاستدلال الموزع جاهزة.
ما التالي
من المتوقع وجود تحسينات إضافية في برنامج تشغيل DRA الإصدار v25.8.0. سيتم رفع قيد البود الواحد لكل عقدة، مع مرونة أكبر في الجدولة مما سيرفع معدلات الاستخدام أكثر. المرحلة التالية من بنية الذكاء الاصطناعي التحتية قادمة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
وحدة معالجة الرسومات الجديدة من NVIDIA تُظهر إمكانياتها الحقيقية مع Kubernetes
ما الذي تغير؟
المنتج الذي أعلنت عنه NVIDIA وهو GB200 NVL72، ليس مجرد وحدة معالجة رسومات عالية الأداء، بل غيّر جذرياً طريقة بناء شبكات GPU بين عدة أجهزة. في السابق، كانت هناك حاجة لإعدادات معقدة يدوية، أما الآن فبات نظام Kubernetes (نظام إدارة الحاويات) يتولى الأمر بشكل شبه تلقائي.
ما هو ComputeDomains؟
ببساطة، هو آلية لربط وحدات GPU الموزعة عبر عدة خوادم بشكل “آمن” و"سريع". تم دمجه في برنامج تشغيل NVIDIA DRA GPU، حيث يتم إنشاء وإدارة مناطق وصول الذاكرة تلقائياً كلما تم جدولة عبء عمل (عملية حسابية). كما تم تعزيز الفصل الأمني والقدرة على التحمل ضد الأعطال.
فوائد التنفيذ
الخلفية: تطور الحوسبة باستخدام GPU
أنظمة NVIDIA DGX القديمة كانت تتوقف عند التوسع داخل جهاز واحد فقط. بعد ظهور NVLink متعدد العقد (MNNVL)، أصبحت اتصالات GPU بين الخوادم المختلفة فائقة السرعة. ComputeDomains الآن هو تنفيذ لهذه التقنية بشكل أصيل على Kubernetes. أصبحت البنية التحتية لتدريب نماذج اللغة الضخمة والاستدلال الموزع جاهزة.
ما التالي
من المتوقع وجود تحسينات إضافية في برنامج تشغيل DRA الإصدار v25.8.0. سيتم رفع قيد البود الواحد لكل عقدة، مع مرونة أكبر في الجدولة مما سيرفع معدلات الاستخدام أكثر. المرحلة التالية من بنية الذكاء الاصطناعي التحتية قادمة.