Web3 AI стратегічний обхід: шлях диференційованого розвитку під багато-модальними бар'єрами

Аналіз тенденцій розвитку Web3 AI

Акції Nvidia знову встановили рекорд, а прогрес мультимодальних моделей поглиблює технологічний бар'єр Web2 AI. Від семантичного вирівнювання до візуального розуміння, від високорозмірних вбудувань до злиття ознак, складні моделі інтегрують різні модальності вираження з небаченою швидкістю, створюючи дедалі замкнутіші AI укріплення. Ринок акцій у США реагує на це позитивно, незалежно від того, чи це акції, пов'язані з криптовалютою, чи акції AI, демонструючи невеликий бичачий ринок.

Однак ця хвиля, здається, не має жодного відношення до сфери криптовалют. Нещодавні спроби Web3 AI, особливо в напрямку Agent, можуть бути не зовсім вірними. Спроба зібрати модульну систему в стилі Web2 з децентралізованою структурою насправді є подвійним невідповідністю як у технології, так і в мисленні. У сьогоднішньому світі, де модулі мають високу ступінь зв'язності, розподіл ознак є надзвичайно нестабільним, а вимоги до обчислювальної потужності все більше зосереджуються, модульність у Web3 важко закріпитися.

Майбутнє Web3 AI не в імітації, а в стратегічному обході. Від семантичного вирівнювання у високих вимірах до інформаційних вузьких місць у механізмі уваги, а також до вирівнювання ознак під різногалузевими обчисленнями, Web3 AI потрібно застосувати тактичну стратегію "села оточують місто".

Web3 AI базується на плоскій багатомодальній моделі, труднощі в семантичній узгодженості призводять до низької продуктивності

У сучасних мультимодальних системах Web2 AI "семантичне вирівнювання" є процесом відображення інформації з різних модальностей в одне семантичне простір, що дозволяє моделі розуміти та порівнювати значення, що стоять за різними формами сигналів. Це потрібно реалізувати в просторі високих вимірів, щоб робочий процес мав сенс у модульному розподілі.

Однак, реалізація високорозмірного вбудовування в протоколі Web3 Agent є складною. Більшість Web3 Agent просто упаковують готові API, їм бракує єдиного центрального вбудованого простору та міжмодульного механізму уваги, що призводить до неможливості багатоаспектної взаємодії інформації, вони можуть лише обробляти лінійно, що ускладнює формування загальної замкнутої оптимізації.

Вимога до Web3 AI реалізувати високорозмірний простір дорівнює вимозі до протоколу агентів самостійно розробити всі залучені API інтерфейси, що суперечить його початковій меті модульності. Високорозмірна архітектура потребує єдиного навчання «від початку до кінця» або спільної оптимізації, а підхід Web3 Agent «модуль – це плагін» навпаки посилює фрагментацію, що призводить до зростання витрат на обслуговування та обмеження загальної продуктивності.

У низьковимірному просторі дизайн механізму уваги обмежений

Високоякісні мультимодальні моделі потребують ретельно спроектованих механізмів уваги. Механізм уваги — це спосіб динамічного розподілу обчислювальних ресурсів, який дозволяє моделі при обробці певного модального введення вибірково "зосереджуватися" на найбільш релевантних частинах.

Передумовою для роботи механізму уваги є наявність високих вимірів у багатомодальних даних. Перш ніж пояснити, чому механізм уваги потребує високовимірного простору, давайте спочатку зрозуміємо процес, який використовує Web2 AI, представлений декодером Transformer, при проектуванні механізму уваги. Основна ідея полягає в тому, що під час обробки послідовностей модель динамічно призначає "ваги уваги" кожному елементу, дозволяючи йому зосередитися на найрелевантнішій інформації.

Query-Key-Value (Q-K-V) є механізмом для визначення ключової інформації. Для мультимодальних моделей вхідними даними можуть бути текст, зображення або аудіо. Щоб знайти необхідний вміст у вимірному просторі, ці дані розбиваються на найменші одиниці, такі як символи, піксельні блоки або аудіофрейми, а модель генерує Q-K-V для обчислення уваги.

Модульна архітектура Web3 AI ускладнює реалізацію єдиного управління увагою. Основні причини включають:

  1. Механізм уваги залежить від єдиного простору Q-K-V, тоді як дані, що повертаються незалежними API, мають різний формат і розподіл, що ускладнює формування єдиного вбудованого шару.

  2. Багаторазова увага дозволяє паралельно звертати увагу на різні джерела інформації, тоді як незалежні API зазвичай є лінійними викликами, що позбавлені паралельності та динамічної ваги.

  3. Справжній механізм уваги базується на динамічному розподілі ваг на основі загального контексту, а в режимі API модулі можуть бачити лише незалежний контекст, що ускладнює реалізацію глобальних зв'язків між модулями.

Отже, просто упаковка функцій у дискретні API не дозволить створити можливість "уніфікованого планування уваги", подібну до тієї, що має Transformer.

Дискретні модульні зшивання, злиття ознак залишається на поверхневому статичному з'єднанні

"Злиття ознак" полягає в комбінації векторів ознак, оброблених різними модальностями, на основі вирівнювання і уваги, для використання в подальших завданнях. Методи злиття можуть бути простими, такими як об'єднання або зважене сумування, або складними, такими як дволінійне згортання, розклад тензора або технології динамічної маршрутизації.

Web3 AI, звичайно, залишається на найпростішій стадії з'єднання, оскільки передумовою для динамічного злиття ознак є високорозмірний простір і точний механізм уваги. Коли ці умови не виконані, злиття ознак природно не може досягти ідеальної продуктивності.

Web2 AI схильний до енд-ту-енд спільного навчання, обробляючи всі модальні характеристики в одному високодовимірному просторі, спільно оптимізуючи через шари уваги та злиття з шарами нижнього рівня завдань. У той час як Web3 AI більше використовує дискретне з'єднання модулів, упаковуючи різні API в незалежні агенти, а потім просто склеюючи їх виходи, не маючи єдиної цілі навчання та міжмодульного градієнтного потоку.

Web2 AI, спираючись на механізм уваги, може в реальному часі обчислювати важливість ознак на основі контексту та динамічно налаштовувати стратегію злиття. Web3 AI, з іншого боку, часто заздалегідь фіксує ваги або використовує прості правила для визначення, чи слід зливати, що призводить до нестачі гнучкості.

Web2 AI відображає всі модальні ознаки у високорозмірний простір, а процес злиття включає різні високорівневі взаємодії. У порівнянні з цим, Web3 AI часто продукує виходи агентів, що містять лише кілька ключових полів, з дуже низькою розмірністю ознак, що ускладнює вираження складних крос-модальних зв'язків.

Заглиблення бар'єрів у сфері ІТ, але проблеми ще не виявились

Багатомодальна система Web2 AI є надзвичайно великим інженерним проєктом, що потребує величезних різноманітних наборів даних, масштабних обчислювальних потужностей, передового мережевого дизайну, складної інженерної реалізації та постійних досліджень алгоритмів. Це створює дуже сильний галузевий бар'єр і формує основну конкурентоспроможність небагатьох провідних команд.

Web3 AI потрібно застосувати тактику "села оточують місто" для розвитку. Її основа полягає в децентралізації, еволюційний шлях проявляється у високій паралельності, низькій зв'язаності та сумісності гетерогенних обчислювальних потужностей. Це надає Web3 AI більші переваги в таких сценах, як крайові обчислення, що підходять для легковагових структур, легкого паралелізму та завдань, що можуть бути мотивованими.

Однак бар'єри Web2 AI лише починають формуватися, це рання стадія конкуренції провідних компаній. Тільки коли бонуси Web2 AI майже зникнуть, залишені ним болі стануть можливістю для входження Web3 AI. До цього часу Web3 AI потрібно накопичити досвід у крайових сценаріях, зберігаючи гнучкість, щоб впоратися з динамічно змінюваними потенційними бар'єрами та болями.

AGENT2.6%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 9
  • Поділіться
Прокоментувати
0/400
LeekCuttervip
· 07-28 18:59
обдурювати людей, як лохів просто закінчується. Слідуйте за ринком, щоб купувати за високими цінами.
Переглянути оригіналвідповісти на0
GateUser-aa7df71evip
· 07-28 18:52
Ця хвиля піку AI досягла свого максимуму, чекайте великого дампу, щоб увійти в позицію.
Переглянути оригіналвідповісти на0
CryptoCross-TalkClubvip
· 07-27 08:49
Знову займаються чорними технологіями, здається, ця хвиля невдахи повинна впасти в новій позі.
Переглянути оригіналвідповісти на0
Lonely_Validatorvip
· 07-26 01:41
Цей веб3-ентузіазм трохи ілюзорний
Переглянути оригіналвідповісти на0
LiquidityWizardvip
· 07-25 19:47
статистично кажучи, ринковий бар'єр nvidia досягає пікової асимптотичної ефективності... веб3 люди все ще цього не розуміють, смх
Переглянути оригіналвідповісти на0
TokenTherapistvip
· 07-25 19:46
Пф, скільки грошей заробив nvidia?
Переглянути оригіналвідповісти на0
NoodlesOrTokensvip
· 07-25 19:38
Старий Хуан знову вгадав правильно
Переглянути оригіналвідповісти на0
MemecoinResearchervip
· 07-25 19:36
фр то... gpu банда їсть добре, поки ми залишаємося ngmi на web3
Переглянути оригіналвідповісти на0
wagmi_eventuallyvip
· 07-25 19:28
Знову булран у когось іншого
Переглянути оригіналвідповісти на0
Дізнатися більше
  • Закріпити