سعر سهم إنفيديا يصل إلى أعلى مستوى جديد، والتقدم في النماذج متعددة الوسائط يعمق الحواجز التقنية للذكاء الاصطناعي في Web2. من المحاذاة الدلالية إلى الفهم البصري، ومن الإدخال عالي الأبعاد إلى دمج الميزات، فإن النماذج المعقدة تدمج طرق التعبير المختلفة بسرعة غير مسبوقة، مما يبني مرتفعات ذكاء اصطناعي مغلقة بشكل متزايد. الأسواق الأمريكية ردت بشكل إيجابي على ذلك، حيث شهدت الأسهم المرتبطة بتشفير العملات وكذلك أسهم الذكاء الاصطناعي سوقًا صاعدة صغيرة.
ومع ذلك، يبدو أن هذه الحماسة لا تتعلق بمجال العملات المشفرة. في الآونة الأخيرة، كانت هناك محاولات في Web3 AI، وخاصة في اتجاه الوكلاء، وقد تكون هناك انحرافات في الاتجاه. محاولة تجميع نظام متعدد الوسائط على نمط Web2 باستخدام هيكل لامركزي، هي في الواقع نوع من عدم التوافق التكنولوجي والفكري. في ظل Coupling modules الشديد، وعدم استقرار توزيع الخصائص، وزيادة الطلب على قوة الحوسبة، من الصعب أن تجد النماذج متعددة الوسائط مكاناً لها في Web3.
مستقبل Web3 AI ليس في التقليد، بل في الالتفاف الاستراتيجي. من محاذاة المعاني في الفضاءات عالية الأبعاد، إلى اختناقات المعلومات في آلية الانتباه، وصولًا إلى محاذاة الخصائص تحت القوة الحاسوبية المتغايرة، يحتاج Web3 AI إلى اتخاذ استراتيجية "الريف يحيط بالمدينة".
الذكاء الاصطناعي Web3 يعتمد على نموذج متعدد الوسائط مسطح، مما يؤدي إلى صعوبة المحاذاة الدلالية وانخفاض الأداء
في أنظمة تعدد الوسائط للذكاء الاصطناعي في Web2 الحديثة، "محاذاة المعنى" هي عملية ربط المعلومات من أشكال متعددة إلى نفس الفضاء الدلالي، مما يمكّن النموذج من فهم ومقارنة المعاني وراء الإشارات بأشكال مختلفة. يتطلب ذلك تحقيق ذلك في فضاء تضمين عالي الأبعاد، بحيث يكون لتدفق العمل المكون من وحدات معنى.
ومع ذلك، فإن بروتوكول Web3 Agent يصعب تحقيق الإدخال العالي الأبعاد. معظم Web3 Agent مجرد تغليف لواجهات برمجة التطبيقات الجاهزة، تفتقر إلى مساحة إدخال مركزية موحدة وآلية انتباه عبر الوحدات، مما يؤدي إلى عدم إمكانية التفاعل مع المعلومات من زوايا متعددة، ويمكن معالجتها فقط بشكل خطي، مما يجعل من الصعب تحقيق تحسين حلقة مغلقة شاملة.
يتطلب تحقيق Web3 AI في الفضاء عالي الأبعاد، مثلما يتطلب من بروتوكول Agent تطوير جميع واجهات API المعنية بنفسه، وهذا يتعارض مع هدفه من التعديل. تتطلب البنية عالية الأبعاد تدريبًا موحدًا من النهاية إلى النهاية أو تحسينًا تعاونيًا، بينما تعزز فكرة "الوحدات كملحقات" الخاصة بـ Web3 Agent من التجزئة، مما يؤدي إلى ارتفاع تكاليف الصيانة، ويقيد الأداء العام.
في الفضاء ذي الأبعاد المنخفضة، تصميم آلية الانتباه محدود
تتطلب النماذج متعددة الوسائط عالية المستوى آلية انتباه مصممة بدقة. تعتبر آلية الانتباه وسيلة لتوزيع الموارد الحسابية ديناميكيًا، مما يسمح للنموذج عند معالجة إدخال معين من نوع معين بالتركيز انتقائيًا على الأجزاء الأكثر صلة.
تتمثل الفرضية الأساسية لعمل آلية الانتباه في أن النماذج متعددة الأنماط تمتلك أبعادًا عالية. قبل شرح لماذا تحتاج آلية الانتباه إلى مساحة ذات أبعاد عالية، دعونا نفهم العملية التي تتبعها الذكاء الاصطناعي من Web2، والتي يمثلها مشفر Transformer، عند تصميم آلية الانتباه. الفكرة الأساسية هي أنه عند معالجة التسلسلات، يقوم النموذج بتوزيع "أوزان الانتباه" ديناميكيًا على كل عنصر، مما يجعله يركز على المعلومات الأكثر صلة.
Query-Key-Value (Q-K-V) هو آلية لتحديد المعلومات الرئيسية. بالنظر إلى النماذج متعددة الوسائط، قد تكون المدخلات نصوصًا أو صورًا أو صوتًا. من أجل استرجاع المحتوى المطلوب في فضاء الأبعاد، يتم تقسيم هذه المدخلات إلى وحدات صغيرة، مثل الأحرف أو كتل البكسل أو إطارات الصوت، حيث يقوم النموذج بتوليد Q-K-V لهذه الوحدات لإجراء حسابات الانتباه.
من الصعب تحقيق جدولة انتباه موحدة في Web3 AI القائم على الوحدات. تشمل الأسباب الرئيسية ما يلي:
تعتمد آلية الانتباه على مساحة Q-K-V موحدة، بينما تختلف تنسيقات البيانات التي تعيدها واجهات برمجة التطبيقات المستقلة وتوزيعها، مما يجعل من الصعب تشكيل طبقة تضمين موحدة.
يسمح الانتباه متعدد الرؤوس بالتركيز في وقت واحد على مصادر معلومات مختلفة، بينما عادةً ما تكون واجهات برمجة التطبيقات المستقلة اتصالات خطية، تفتقر إلى القدرة على الوزن المتوازي والديناميكي المتعدد.
آلية الانتباه الحقيقية تعتمد على تخصيص الوزن الديناميكي استنادًا إلى السياق الكلي، بينما في نمط API لا يمكن للوحدات رؤية السياق المستقل، مما يجعل من الصعب تحقيق الارتباط العالمي عبر الوحدات.
لذلك، لا يمكن بناء قدرة "جدولة الانتباه الموحد" مثل Transformer فقط من خلال تغليف الوظائف في واجهات برمجة التطبيقات المنفصلة.
تجميع وحدات متباينة، دمج الميزات يبقى في التوصيل الساكن السطحي
"دمج الميزات" هو تجميع لمتجهات الميزات المعالجة من نماذج متعددة بناءً على المحاذاة والانتباه، لاستخدامها في المهام اللاحقة. يمكن أن تكون وسائل الدمج بسيطة مثل التوصيل أو الجمع الوزني، أو قد تكون معقدة مثل التجميع الثنائي أو تحليل الموتر أو تقنيات التوجيه الديناميكي.
بالطبع ، Web3 AI لا يزال في مرحلة الربط الأساسية فقط ، لأن دمج الميزات الديناميكية يتطلب مساحة عالية الأبعاد وآلية انتباه دقيقة. عندما لا تتوفر هذه الشروط ، فإن دمج الميزات لا يمكن أن يصل إلى الأداء المثالي.
تميل الذكاء الاصطناعي في Web2 إلى التدريب المشترك من البداية إلى النهاية، حيث تعالج جميع ميزات الوضع في نفس الفضاء عالي الأبعاد، وتقوم بتحسين التعاون مع طبقات الانتباه وطبقات الدمج وطبقات المهام السفلية. بينما يعتمد الذكاء الاصطناعي في Web3 بشكل أكبر على تجميع الوحدات المنفصلة، حيث يتم تغليف أنواع مختلفة من واجهات البرمجة كوكيل مستقل، ثم يتم تجميع ناتجها ببساطة، مما يفتقر إلى هدف تدريب موحد وتدفق تدرجات عبر الوحدات.
يعتمد Web2 AI على آلية الانتباه، حيث يمكنه حساب أهمية الميزات في الوقت الحقيقي بناءً على السياق وضبط استراتيجيات الدمج ديناميكيًا. بينما غالبًا ما يحدد Web3 AI الأوزان مسبقًا أو يستخدم قواعد بسيطة لتحديد ما إذا كان يجب الدمج، مما يفتقر إلى المرونة.
تقوم Web2 AI بتمثيل جميع ميزات النماذج في فضاء عالي الأبعاد، وتشمل عملية الدمج مجموعة من العمليات التفاعلية عالية الترتيب. بالمقارنة، فإن مخرجات Web3 AI من وكلاء مختلفين غالبًا ما تحتوي فقط على عدد قليل من الحقول الرئيسية، مما يعني أن أبعاد الميزات منخفضة للغاية، مما يجعل من الصعب التعبير عن العلاقات المعقدة عبر النماذج.
تعمق الحواجز في صناعة الذكاء الاصطناعي، لكن النقاط المؤلمة لم تظهر بعد
نظام Web2 AI متعدد الوسائط هو مشروع هندسي ضخم للغاية، يتطلب مجموعات بيانات ضخمة ومتنوعة، وقوة حسابية كبيرة، وتصميم شبكات متقدمة، وتنفيذ هندسي معقد، وتطوير مستمر للخوارزميات. وهذا يشكل حاجزًا قويًا في الصناعة، كما أنه يخلق القوة التنافسية الأساسية لعدد قليل من الفرق الرائدة.
تحتاج Web3 AI إلى اعتماد استراتيجية "الريف محاصر للمدينة" للتطور. يكمن جوهرها في اللامركزية، ويظهر مسار التطور في التوازي العالي، والارتباط المنخفض، وتوافق القدرة الحاسوبية المتغايرة. وهذا يجعل Web3 AI أكثر ميزة في سيناريوهات مثل الحوسبة الطرفية، حيث تناسب الهياكل الخفيفة، والمهام السهلة التوازي، والقابلة للتحفيز.
ومع ذلك، فإن حواجز Web2 AI بدأت للتو في التكون، وهذه هي المرحلة المبكرة من المنافسة بين الشركات الرائدة. فقط عندما تختفي فوائد Web2 AI تمامًا، ستكون النقاط المؤلمة التي خلفتها فرصة دخول Web3 AI. قبل ذلك، يحتاج Web3 AI إلى اكتساب الخبرة في السيناريوهات الحدودية، والحفاظ على المرونة للتعامل مع الحواجز والنقاط المؤلمة المحتملة المتغيرة ديناميكيًا.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 20
أعجبني
20
9
مشاركة
تعليق
0/400
LeekCutter
· 07-28 18:59
خداع الناس لتحقيق الربح就完事了 跟着 السوق炒高买入
شاهد النسخة الأصليةرد0
GateUser-aa7df71e
· 07-28 18:52
هذه الذروة في الذكاء الاصطناعي وصلت إلى ذروتها انتظر هبوط كبير ثم ادخل مركز
شاهد النسخة الأصليةرد0
CryptoCross-TalkClub
· 07-27 08:49
مرة أخرى يقومون بتطوير التكنولوجيا السوداء، يبدو أن هذه الموجة من الحمقى ستتغير طريقة هبوطها.
شاهد النسخة الأصليةرد0
Lonely_Validator
· 07-26 01:41
هذه الحمى المتعلقة بـ web3 تبدو غير حقيقية قليلاً
شاهد النسخة الأصليةرد0
LiquidityWizard
· 07-25 19:47
إحصائيًا، فإن خندق إنفيديا يصل إلى ذروة الكفاءة اللانهائية... لا يزال الناس في ويب 3 لا يفهمون ذلك، أشعر بالأسف لذلك.
شاهد النسخة الأصليةرد0
TokenTherapist
· 07-25 19:46
Poof: كم تذهب nvidia
شاهد النسخة الأصليةرد0
NoodlesOrTokens
· 07-25 19:38
لقد أصاب لاو هوانغ مرة أخرى
شاهد النسخة الأصليةرد0
MemecoinResearcher
· 07-25 19:36
فر ثو... عصابة GPU تأكل جيدًا بينما نبقى ngmi على الويب 3
استراتيجية الالتفاف الذكي في Web3: طريق التنمية المتمايزة تحت الحواجز متعددة الوسائط
تحليل اتجاهات تطوير Web3 AI
سعر سهم إنفيديا يصل إلى أعلى مستوى جديد، والتقدم في النماذج متعددة الوسائط يعمق الحواجز التقنية للذكاء الاصطناعي في Web2. من المحاذاة الدلالية إلى الفهم البصري، ومن الإدخال عالي الأبعاد إلى دمج الميزات، فإن النماذج المعقدة تدمج طرق التعبير المختلفة بسرعة غير مسبوقة، مما يبني مرتفعات ذكاء اصطناعي مغلقة بشكل متزايد. الأسواق الأمريكية ردت بشكل إيجابي على ذلك، حيث شهدت الأسهم المرتبطة بتشفير العملات وكذلك أسهم الذكاء الاصطناعي سوقًا صاعدة صغيرة.
ومع ذلك، يبدو أن هذه الحماسة لا تتعلق بمجال العملات المشفرة. في الآونة الأخيرة، كانت هناك محاولات في Web3 AI، وخاصة في اتجاه الوكلاء، وقد تكون هناك انحرافات في الاتجاه. محاولة تجميع نظام متعدد الوسائط على نمط Web2 باستخدام هيكل لامركزي، هي في الواقع نوع من عدم التوافق التكنولوجي والفكري. في ظل Coupling modules الشديد، وعدم استقرار توزيع الخصائص، وزيادة الطلب على قوة الحوسبة، من الصعب أن تجد النماذج متعددة الوسائط مكاناً لها في Web3.
مستقبل Web3 AI ليس في التقليد، بل في الالتفاف الاستراتيجي. من محاذاة المعاني في الفضاءات عالية الأبعاد، إلى اختناقات المعلومات في آلية الانتباه، وصولًا إلى محاذاة الخصائص تحت القوة الحاسوبية المتغايرة، يحتاج Web3 AI إلى اتخاذ استراتيجية "الريف يحيط بالمدينة".
الذكاء الاصطناعي Web3 يعتمد على نموذج متعدد الوسائط مسطح، مما يؤدي إلى صعوبة المحاذاة الدلالية وانخفاض الأداء
في أنظمة تعدد الوسائط للذكاء الاصطناعي في Web2 الحديثة، "محاذاة المعنى" هي عملية ربط المعلومات من أشكال متعددة إلى نفس الفضاء الدلالي، مما يمكّن النموذج من فهم ومقارنة المعاني وراء الإشارات بأشكال مختلفة. يتطلب ذلك تحقيق ذلك في فضاء تضمين عالي الأبعاد، بحيث يكون لتدفق العمل المكون من وحدات معنى.
ومع ذلك، فإن بروتوكول Web3 Agent يصعب تحقيق الإدخال العالي الأبعاد. معظم Web3 Agent مجرد تغليف لواجهات برمجة التطبيقات الجاهزة، تفتقر إلى مساحة إدخال مركزية موحدة وآلية انتباه عبر الوحدات، مما يؤدي إلى عدم إمكانية التفاعل مع المعلومات من زوايا متعددة، ويمكن معالجتها فقط بشكل خطي، مما يجعل من الصعب تحقيق تحسين حلقة مغلقة شاملة.
يتطلب تحقيق Web3 AI في الفضاء عالي الأبعاد، مثلما يتطلب من بروتوكول Agent تطوير جميع واجهات API المعنية بنفسه، وهذا يتعارض مع هدفه من التعديل. تتطلب البنية عالية الأبعاد تدريبًا موحدًا من النهاية إلى النهاية أو تحسينًا تعاونيًا، بينما تعزز فكرة "الوحدات كملحقات" الخاصة بـ Web3 Agent من التجزئة، مما يؤدي إلى ارتفاع تكاليف الصيانة، ويقيد الأداء العام.
في الفضاء ذي الأبعاد المنخفضة، تصميم آلية الانتباه محدود
تتطلب النماذج متعددة الوسائط عالية المستوى آلية انتباه مصممة بدقة. تعتبر آلية الانتباه وسيلة لتوزيع الموارد الحسابية ديناميكيًا، مما يسمح للنموذج عند معالجة إدخال معين من نوع معين بالتركيز انتقائيًا على الأجزاء الأكثر صلة.
تتمثل الفرضية الأساسية لعمل آلية الانتباه في أن النماذج متعددة الأنماط تمتلك أبعادًا عالية. قبل شرح لماذا تحتاج آلية الانتباه إلى مساحة ذات أبعاد عالية، دعونا نفهم العملية التي تتبعها الذكاء الاصطناعي من Web2، والتي يمثلها مشفر Transformer، عند تصميم آلية الانتباه. الفكرة الأساسية هي أنه عند معالجة التسلسلات، يقوم النموذج بتوزيع "أوزان الانتباه" ديناميكيًا على كل عنصر، مما يجعله يركز على المعلومات الأكثر صلة.
Query-Key-Value (Q-K-V) هو آلية لتحديد المعلومات الرئيسية. بالنظر إلى النماذج متعددة الوسائط، قد تكون المدخلات نصوصًا أو صورًا أو صوتًا. من أجل استرجاع المحتوى المطلوب في فضاء الأبعاد، يتم تقسيم هذه المدخلات إلى وحدات صغيرة، مثل الأحرف أو كتل البكسل أو إطارات الصوت، حيث يقوم النموذج بتوليد Q-K-V لهذه الوحدات لإجراء حسابات الانتباه.
من الصعب تحقيق جدولة انتباه موحدة في Web3 AI القائم على الوحدات. تشمل الأسباب الرئيسية ما يلي:
تعتمد آلية الانتباه على مساحة Q-K-V موحدة، بينما تختلف تنسيقات البيانات التي تعيدها واجهات برمجة التطبيقات المستقلة وتوزيعها، مما يجعل من الصعب تشكيل طبقة تضمين موحدة.
يسمح الانتباه متعدد الرؤوس بالتركيز في وقت واحد على مصادر معلومات مختلفة، بينما عادةً ما تكون واجهات برمجة التطبيقات المستقلة اتصالات خطية، تفتقر إلى القدرة على الوزن المتوازي والديناميكي المتعدد.
آلية الانتباه الحقيقية تعتمد على تخصيص الوزن الديناميكي استنادًا إلى السياق الكلي، بينما في نمط API لا يمكن للوحدات رؤية السياق المستقل، مما يجعل من الصعب تحقيق الارتباط العالمي عبر الوحدات.
لذلك، لا يمكن بناء قدرة "جدولة الانتباه الموحد" مثل Transformer فقط من خلال تغليف الوظائف في واجهات برمجة التطبيقات المنفصلة.
تجميع وحدات متباينة، دمج الميزات يبقى في التوصيل الساكن السطحي
"دمج الميزات" هو تجميع لمتجهات الميزات المعالجة من نماذج متعددة بناءً على المحاذاة والانتباه، لاستخدامها في المهام اللاحقة. يمكن أن تكون وسائل الدمج بسيطة مثل التوصيل أو الجمع الوزني، أو قد تكون معقدة مثل التجميع الثنائي أو تحليل الموتر أو تقنيات التوجيه الديناميكي.
بالطبع ، Web3 AI لا يزال في مرحلة الربط الأساسية فقط ، لأن دمج الميزات الديناميكية يتطلب مساحة عالية الأبعاد وآلية انتباه دقيقة. عندما لا تتوفر هذه الشروط ، فإن دمج الميزات لا يمكن أن يصل إلى الأداء المثالي.
تميل الذكاء الاصطناعي في Web2 إلى التدريب المشترك من البداية إلى النهاية، حيث تعالج جميع ميزات الوضع في نفس الفضاء عالي الأبعاد، وتقوم بتحسين التعاون مع طبقات الانتباه وطبقات الدمج وطبقات المهام السفلية. بينما يعتمد الذكاء الاصطناعي في Web3 بشكل أكبر على تجميع الوحدات المنفصلة، حيث يتم تغليف أنواع مختلفة من واجهات البرمجة كوكيل مستقل، ثم يتم تجميع ناتجها ببساطة، مما يفتقر إلى هدف تدريب موحد وتدفق تدرجات عبر الوحدات.
يعتمد Web2 AI على آلية الانتباه، حيث يمكنه حساب أهمية الميزات في الوقت الحقيقي بناءً على السياق وضبط استراتيجيات الدمج ديناميكيًا. بينما غالبًا ما يحدد Web3 AI الأوزان مسبقًا أو يستخدم قواعد بسيطة لتحديد ما إذا كان يجب الدمج، مما يفتقر إلى المرونة.
تقوم Web2 AI بتمثيل جميع ميزات النماذج في فضاء عالي الأبعاد، وتشمل عملية الدمج مجموعة من العمليات التفاعلية عالية الترتيب. بالمقارنة، فإن مخرجات Web3 AI من وكلاء مختلفين غالبًا ما تحتوي فقط على عدد قليل من الحقول الرئيسية، مما يعني أن أبعاد الميزات منخفضة للغاية، مما يجعل من الصعب التعبير عن العلاقات المعقدة عبر النماذج.
تعمق الحواجز في صناعة الذكاء الاصطناعي، لكن النقاط المؤلمة لم تظهر بعد
نظام Web2 AI متعدد الوسائط هو مشروع هندسي ضخم للغاية، يتطلب مجموعات بيانات ضخمة ومتنوعة، وقوة حسابية كبيرة، وتصميم شبكات متقدمة، وتنفيذ هندسي معقد، وتطوير مستمر للخوارزميات. وهذا يشكل حاجزًا قويًا في الصناعة، كما أنه يخلق القوة التنافسية الأساسية لعدد قليل من الفرق الرائدة.
تحتاج Web3 AI إلى اعتماد استراتيجية "الريف محاصر للمدينة" للتطور. يكمن جوهرها في اللامركزية، ويظهر مسار التطور في التوازي العالي، والارتباط المنخفض، وتوافق القدرة الحاسوبية المتغايرة. وهذا يجعل Web3 AI أكثر ميزة في سيناريوهات مثل الحوسبة الطرفية، حيث تناسب الهياكل الخفيفة، والمهام السهلة التوازي، والقابلة للتحفيز.
ومع ذلك، فإن حواجز Web2 AI بدأت للتو في التكون، وهذه هي المرحلة المبكرة من المنافسة بين الشركات الرائدة. فقط عندما تختفي فوائد Web2 AI تمامًا، ستكون النقاط المؤلمة التي خلفتها فرصة دخول Web3 AI. قبل ذلك، يحتاج Web3 AI إلى اكتساب الخبرة في السيناريوهات الحدودية، والحفاظ على المرونة للتعامل مع الحواجز والنقاط المؤلمة المحتملة المتغيرة ديناميكيًا.