يعزز التوازي الهجين المفكك المبتكر من راي بشكل كبير كفاءة التدريب في الذكاء الاصطناعي متعدد الوسائط، محققا تحسينا يصل إلى 1.37 ضعف معدل النقل ويتغلب على تحديات الذاكرة.
في تطور مهم لتدريب الذكاء الاصطناعي، قدم راي نهج التوازي الهجين المفكك الذي يسرع تدريب نماذج الذكاء الاصطناعي متعددة الوسائط بنسبة 30٪، وفقا لموقع Anyscale. يعالج هذا التطور التعقيدات والتحديات الحاسوبية لنماذج التدريب التي تعالج أنواع بيانات متنوعة مثل النصوص والصور والصوت.
تحديات في تدريب الذكاء الاصطناعي متعدد الوسائط
نماذج الذكاء الاصطناعي متعددة الوسائط، على عكس نماذج اللغة الكبيرة المتجانسة التقليدية، تتكون من وحدات متخصصة باحتياجات حسابية وذاكرة متنوعة. على سبيل المثال، تدمج نماذج اللغة والرؤية (VLMs) مشفر رؤية مع نموذج لغوي كبير (LLM). يؤدي هذا التكامل إلى تعقيدات معمارية، خاصة عند التعامل مع الصور عالية الدقة والتسلسلات الطويلة. التقنيات التقليدية مثل التوازي الموتري وDeepSpeed ZeRO3 غالبا ما تفشل في ذلك، مما يؤدي إلى عدم كفاءة وأخطاء محتملة في نفاد الذاكرة.
نهج راي المبتكر
يستفيد التوازي الهجين المفكك من مرونة إطاره العالمي، مما يتيح استراتيجيات توازي مخصصة لكل وحدة ضمن نموذج متعدد الوسائط. باستخدام بنية راي القائمة على الممثلين، يمكن للمطورين تخصيص الموارد بشكل مستقل، مع تحسين المتطلبات الفريدة لكل وحدة. ينتج عن ذلك تنسيق أعباء العمل المعقدة أكثر كفاءة، كما هو موضح في نموذج Qwen-VL 32B.
المقارنة والأداء
في الاختبارات التي أجريت باستخدام نموذج Qwen-VL 32B، أظهر نهج راي تحسنا بنسبة 1.37 مرة في معدل النقل مقارنة بالطرق التقليدية. جمعت الاستراتيجية بين التوازي التسلسلي لمشفر الرؤية والتوازي الموتري لنموذج اللغة الكبيرة، مما أدار بفعالية متطلبات الذاكرة والحوسبة عبر وحدات مختلفة. لم تحسن هذه الطريقة السرعة فحسب، بل مكنت أيضا من تدريب تسلسلات تصل طوله إلى 65,000 رمز، متجاوزة قدرات DeepSpeed ZeRO3 التي واجهت مشاكل في الذاكرة عند 16,000 رمز.
آفاق المستقبل
نجاح التوازي الهجين المفكك من راي في تعزيز كفاءة تدريب الذكاء الاصطناعي يمهد الطريق لتطبيقه على مجموعات وحدات معالجة الرسوميات الأكبر وإعدادات الأجهزة المتنوعة. قدرتها على التكيف مع بنى متعددة الوسائط تبرز إمكاناتها في تنفيذ أوسع في تطوير الذكاء الاصطناعي.
لمن يهتم باستكشاف هذا النهج المبتكر، فإن تنفيذ راي متاح للتجربة والتغذية الراجعة على مستودع GitHub الخاص بهم.
مصدر الصورة: شاترستوك
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
يعزز التوازي الهجين المفكك من راي تدريب الذكاء الاصطناعي متعدد الوسائط بنسبة 30٪
إيريس كولمان
10 ديسمبر 2025 01:06
يعزز التوازي الهجين المفكك المبتكر من راي بشكل كبير كفاءة التدريب في الذكاء الاصطناعي متعدد الوسائط، محققا تحسينا يصل إلى 1.37 ضعف معدل النقل ويتغلب على تحديات الذاكرة.
في تطور مهم لتدريب الذكاء الاصطناعي، قدم راي نهج التوازي الهجين المفكك الذي يسرع تدريب نماذج الذكاء الاصطناعي متعددة الوسائط بنسبة 30٪، وفقا لموقع Anyscale. يعالج هذا التطور التعقيدات والتحديات الحاسوبية لنماذج التدريب التي تعالج أنواع بيانات متنوعة مثل النصوص والصور والصوت.
تحديات في تدريب الذكاء الاصطناعي متعدد الوسائط
نماذج الذكاء الاصطناعي متعددة الوسائط، على عكس نماذج اللغة الكبيرة المتجانسة التقليدية، تتكون من وحدات متخصصة باحتياجات حسابية وذاكرة متنوعة. على سبيل المثال، تدمج نماذج اللغة والرؤية (VLMs) مشفر رؤية مع نموذج لغوي كبير (LLM). يؤدي هذا التكامل إلى تعقيدات معمارية، خاصة عند التعامل مع الصور عالية الدقة والتسلسلات الطويلة. التقنيات التقليدية مثل التوازي الموتري وDeepSpeed ZeRO3 غالبا ما تفشل في ذلك، مما يؤدي إلى عدم كفاءة وأخطاء محتملة في نفاد الذاكرة.
نهج راي المبتكر
يستفيد التوازي الهجين المفكك من مرونة إطاره العالمي، مما يتيح استراتيجيات توازي مخصصة لكل وحدة ضمن نموذج متعدد الوسائط. باستخدام بنية راي القائمة على الممثلين، يمكن للمطورين تخصيص الموارد بشكل مستقل، مع تحسين المتطلبات الفريدة لكل وحدة. ينتج عن ذلك تنسيق أعباء العمل المعقدة أكثر كفاءة، كما هو موضح في نموذج Qwen-VL 32B.
المقارنة والأداء
في الاختبارات التي أجريت باستخدام نموذج Qwen-VL 32B، أظهر نهج راي تحسنا بنسبة 1.37 مرة في معدل النقل مقارنة بالطرق التقليدية. جمعت الاستراتيجية بين التوازي التسلسلي لمشفر الرؤية والتوازي الموتري لنموذج اللغة الكبيرة، مما أدار بفعالية متطلبات الذاكرة والحوسبة عبر وحدات مختلفة. لم تحسن هذه الطريقة السرعة فحسب، بل مكنت أيضا من تدريب تسلسلات تصل طوله إلى 65,000 رمز، متجاوزة قدرات DeepSpeed ZeRO3 التي واجهت مشاكل في الذاكرة عند 16,000 رمز.
آفاق المستقبل
نجاح التوازي الهجين المفكك من راي في تعزيز كفاءة تدريب الذكاء الاصطناعي يمهد الطريق لتطبيقه على مجموعات وحدات معالجة الرسوميات الأكبر وإعدادات الأجهزة المتنوعة. قدرتها على التكيف مع بنى متعددة الوسائط تبرز إمكاناتها في تنفيذ أوسع في تطوير الذكاء الاصطناعي.
لمن يهتم باستكشاف هذا النهج المبتكر، فإن تنفيذ راي متاح للتجربة والتغذية الراجعة على مستودع GitHub الخاص بهم.
مصدر الصورة: شاترستوك