عملاق التكنولوجيا يراهن جميعًا على تطوير شرائح الذكاء الاصطناعي الخاصة بهم، ومعركة شرائح الذكاء الاصطناعي تتسارع نحو الانتقال إلى جانب الاستنتاجات

يشهد الانتشار المتسارع للذكاء الاصطناعي التوليدي إعادة تشكيل المشهد التنافسي برمته في صناعة أشباه الموصلات. ساحة المعركة الأساسية في سوق شرائح الذكاء الاصطناعي تتحول بنحو بنيوي من مرحلة تدريب النماذج إلى مرحلة الاستدلال——ولا يقتصر ذلك على ما يتعلق بأولويات تصميم الشرائح فحسب، بل سيؤثر بعمق كذلك على منطق استثمارات البنية التحتية والنماذج التجارية والاتجاه طويل الأمد لسلسلة توريد أشباه الموصلات.

توجد إشارات واضحة على الارتفاع الحاد في احتياجات الاستدلال. أدت الانفجارات في سيناريوهات تطبيقات فيروسية مثل توليد الصور بأسلوب جيبلي إلى تشبع كامل لموارد GPUs الخاصة بـ OpenAI. صرّح الرئيس التنفيذي لشركة OpenAI Sam Altman علنًا بأنه لم ير أبدًا نموًا بهذه السرعة في الاستخدام، لذا اضطررت GPT-4.5 إلى الإصدار على مراحل، مع فتح الوصول في البداية للمستخدمين المدفوعين فقط. تواجه شركات رائدة أخرى في مجال الذكاء الاصطناعي مثل Meta أيضًا اختناقات مماثلة في القدرة الحوسبية. وفي الوقت نفسه، تقوم OpenAI بتطوير شرائح ذكاء اصطناعي داخليًا بهدف تحقيق الإنتاج الكمي حول عام 2026، بهدف تقليل الاعتماد على إنفيديا؛ ويُذكر أن مشروع مراكز البيانات الفائقة “بوابة النجوم” الذي يجري تطويره بالتعاون مع مايكروسوفت يصل حجم استثماره إلى ما يناهز 500B دولار.

تشير هذه التطورات إلى أن الاستدلال في مجال الذكاء الاصطناعي بات يشكل عمودًا استراتيجيًا جنبًا إلى جنب مع مراكز البيانات والبنية التحتية السحابية وأشباه الموصلات. وبالنسبة للمستثمرين، فهذا يعني أن تركيز القيمة في استثمارات الحوسبة الخاصة بالذكاء الاصطناعي يتحرك: تمثل شرائح التدريب إنفاقًا رأسماليًا لمرة واحدة، بينما ترتبط شرائح الاستدلال بنموذج استهلاك إيرادات مستمر——فالذكاء الاصطناعي يتحول من أداة تقنية إلى محرك حوسبة يتم تسعيره بالاعتماد على الاستخدام.

التدريب والاستدلال: نوعان مختلفان تمامًا من احتياجات الحوسبة

لفهم هذا التحول البنيوي، يلزم أولًا توضيح الفروق الجوهرية بين التدريب والاستدلال من حيث طبيعة أحمال العمل.

مرحلة التدريب تعتمد على بنية Transformer التي أطلقتها Google في عام 2017، وتتطلب إجراء الانتشار الأمامي والانتشار العكسي على مجموعات بيانات ضخمة جدًا، مع تحديث مستمر لأوزان النموذج، بما يشمل عمليات حساب مصفوفية بحجم هائل، وحسابات التدرج، وتحديثات المعلمات، وغالبًا ما تحتاج إلى حوسبة موزعة لأسابيع بل وحتى شهور على مجموعات متعددة من GPUs أو TPUs. لذلك يجب أن تتمتع شرائح التدريب بقدرات نوى حسابية عالية الكثافة، وذاكرة سعة كبيرة وعرض نطاق عالٍ (مثل HBM)، وإمكانية التوسع الأفقي عبر شرائح متعددة.

مرحلة الاستدلال، من جهة أخرى، أكثر بساطة في بنيتها: يلزم فقط الانتشار الأمامي، دون الحاجة لتحديثات التدرج أو الانتشار العكسي، وتكون القدرة الحوسبية المطلوبة عادة أقل بمرتبة تقريبًا من التدريب. ومع ذلك، يتمثل التحدي الحقيقي في الاستدلال في ثلاثة قيود——زمن تأخير منخفض (يتوقع المستخدمون استجابة فورية)، وإنتاجية عالية (يجب على المزودين التعامل مع استعلامات متزامنة هائلة)، وتكلفة منخفضة (فإن التكلفة لكل استعلام تؤثر مباشرة على جدوى الأعمال). وهذه المتطلبات تتعارض جذريًا مع منطق مرحلة التدريب “الذي لا يحتسب التأخير ويسعى إلى أقصى أداء”، كما تحدد أن تصميم شرائح الاستدلال يجب أن يسلك مسارًا مميزًا: أولوية كفاءة الطاقة، وتحسين نقل البيانات، وتعظيم الاستفادة من مستويات الذاكرة وعرض النطاق، وتحسين متكامل بين العتاد والبرمجيات.

شركات السحابة فائقة الحجم والشركات الناشئة تتسارع في بناء شرائح الاستدلال

وبناءً على فروق البنية المذكورة أعلاه، يختار عدد متزايد من الشركات تجنب المنافسة المباشرة على سوق GPUs الخاصة بالتدريب لصالح إنفيديا، والانتقال إلى بناء شرائح مخصصة مُحسّنة للاستدلال.

بالنسبة لشركات السحابة فائقة الحجم، قدمت Google TPU (للتدريب) وEdge TPU (للاستدلال على الحافة)، ونشرت Amazon Inferentia وTrainium، وطورت Meta MTIA (Meta Training and Inference Accelerator). كما أن معسكر الشركات الناشئة نشط أيضًا، حيث تسعى شركات مثل Groq وTenstorrent وCerebras وSambaNova إلى إيجاد اختراقات مميزة في أبعاد مثل بنية تدفق البيانات، وتخصيص مساحة الشريحة، وكفاءة استهلاك الطاقة، وأنماط وصول الذاكرة، وتصميم نوى الحوسبة، بهدف تجاوز GPUs العامة من حيث كفاءة الاستدلال وبنية التكاليف.

ترتبط تشكل خريطة المنافسة هذه ارتباطًا وثيقًا بتطور سيناريوهات تطبيقات الذكاء الاصطناعي. ومع تطور الذكاء الاصطناعي من الأسئلة والأجوبة البسيطة إلى أنظمة الذكاء الفعّال (Agentic AI)——القادرة على التخطيط للمهام، وتنفيذ سير العمل، واستدعاء الأدوات وحتى استبدال جزء من الأعمال اليدوية——ستستمر متطلبات الاستدلال ليس فقط في النمو، بل وستتسارع كذلك في التوسع. إن متطلبات أنظمة الوكلاء من حيث زمن تأخير منخفض، وعرض نطاق ذاكرة مرتفع، وقدرة حوسبة مستمرة، ستعزز أكثر من القيمة الاستراتيجية للشرائح المخصصة للاستدلال.

إنفيديا: من قائد عصر التدريب إلى الجهة التي تضع قواعد عصر الاستدلال

في مواجهة هذا التحول البنيوي، لم تتعامل إنفيديا معه بشكل سلبي، بل قامت بتوسيع تخطيطها في سوق الاستدلال بنشاط.

الهدف الأساسي في أحدث بنية Blackwell هو رفع الإنتاجية مع تقليل تكلفة توليد كل token. تشكل هذه المنطق عجلة دافعة إيجابية: انخفاض التكاليف → زيادة الاستخدام → توسع الطلب → رفع حجم البنية التحتية، مما يدفع النمو الأُسّي في الاقتصاد الخاص بالذكاء الاصطناعي. على مستوى النظام، تقوم إنفيديا ببناء بنية “مصنع للذكاء الاصطناعي” يمكنها التعامل مع نوافذ سياق أطول، ومهام استدلال أكثر تعقيدًا، وسير عمل ذكاء اصطناعي متعدد الخطوات، عبر عناقيد كبيرة من GPUs عالية التكامل المحكم مثل NVL72، ودفع البنية التحتية للذكاء الاصطناعي نحو اتجاه أكثر مركزية، وكثافة أعلى، ومدفوع بالأنظمة.

ومع ذلك، فإن الحاجز الحقيقي الذي تتمتع به إنفيديا لا يقتصر على العتاد فحسب. من CUDA إلى TensorRT-LLM ومكدس البرمجيات المخصص لتحسين الاستدلال، تعمل إنفيديا على الانتقال من كونها مورّد شرائح إلى كونها مزودًا للبنية التحتية الكاملة للذكاء الاصطناعي. تواصل شركات مزودي الخدمات السحابية مثل مايكروسوفت وOracle وCoreWeave الاقتراب من هذه البنية، ما يعزز كذلك كلفة التحويل العالية في نظامها البيئي وتأثير توحيد معايير الصناعة. لا يشتري الزبائن بعد اليوم GPU فقط، بل يشترون منصة مصنع للذكاء الاصطناعي كاملة.

ومع ذلك، ترتفع حدة المنافسة في سوق الاستدلال بشكل ملحوظ. لم تعد شرائح الاستدلال خيارًا ثانويًا لشرائح التدريب، بل أصبحت تتحول إلى محرك القدرة الحوسبية الرئيسي لخدمات الذكاء الاصطناعي السحابية، والأجهزة على الحافة، والأنظمة المدمجة، والتطبيقات الزمنية الفورية. وبفعل الدفع المزدوج من تطور العتاد وتوسع التطبيقات، فإن القضية الأساسية في منافسة شرائح الذكاء الاصطناعي تتغير جذريًا: من “من يستطيع تدريب أكبر نموذج” إلى “من يمكنه تشغيل النموذج بأعلى كفاءة ضمن سيناريوهات واسعة النطاق”.

يُعيد التحول البنيوي تشكيل المشهد التنافسي لصناعة أشباه الموصلات

تجاوز تأثير هذا الانتقال من التدريب إلى الاستدلال حدود تصميم الشرائح نفسها، ويخترق بعمق ثلاثة أبعاد: معمارية أنظمة الذكاء الاصطناعي، واستراتيجيات النشر التجارية، وبنية سلسلة التوريد.

على مستوى نموذج الأعمال، يحدث إعادة بناء جذرية للمنطق الاقتصادي للذكاء الاصطناعي. يرتبط التدريب بنفقات رأسمالية، ويرتبط الاستدلال بإيرادات مستمرة——وتتحرك القدرة الحوسبية من مؤشرات تقنية ترتبط مباشرة بالإيرادات، بينما تتحول GPUs من مجرد أجهزة عتادية إلى آلات توليد للـ token. تعني هذه القفزة في النموذج أن حجم وكفاءة البنية التحتية للاستدلال ستحددان بشكل مباشر قابلية أرباح شركات الذكاء الاصطناعي وقدرة التحصين أمام المنافسة.

على مستوى سلسلة التوريد، فإن بروز حقبة ما بعد التدريب——بما في ذلك الاستخدام الواسع لتقنيات مثل الضبط الدقيق (fine-tuning)، وLoRA، والمُكيّفات (adapters)——وكذلك وسائل تعزيز الاستدلال مثل تعديل بنية الـ prompts بشكل ديناميكي والتعاون بين نماذج متعددة——يعمل على زيادة الاعتماد بشكل كبير على القدرة الحوسبية للاستدلال، ويدفع إلى التوسع السريع في الطلب على عتاد استدلال متنوع مثل NPU وASIC وFPGA.

وبالنسبة للمستثمرين، فإن هذا التحول البنيوي يشير إلى إشارة سوقية واضحة: ينتقل تركيز قيمة استثمارات البنية التحتية للذكاء الاصطناعي من جهة التدريب إلى جهة الاستدلال، وستتمكن الشركات التي تحقق ميزة في الأبعاد الثلاثة——كفاءة الاستدلال وضبط التكاليف والنشر على نطاق واسع——من اكتساب زمام المبادرة في جولة المنافسة التالية على القدرة الحوسبية للذكاء الاصطناعي.

تنبيه بشأن المخاطر وشروط الإخلاء من المسؤولية

        للسوق مخاطر، واستثمر بحذر. لا يشكل هذا المقال توصية استثمارية شخصية، ولم يأخذ بعين الاعتبار الأهداف الاستثمارية الخاصة لمستخدمين محددين، أو الوضع المالي، أو الاحتياجات. ينبغي على المستخدم أن يقيّم ما إذا كانت أي آراء أو وجهات نظر أو استنتاجات واردة في هذا المقال تتوافق مع وضعه الخاص. وبناءً على ذلك الاستثمار، تكون المسؤولية على عاتقك.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.22Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.49Kعدد الحائزين:3
    1.98%
  • القيمة السوقية:$2.21Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:2
    0.15%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • تثبيت