Данные как актив: DataFi открывает новое голубое море
В этом месяце самым обсуждаемым вопросом в сфере ИИ является масштабный набор кадров компанией Meta, которая создала роскошную команду ИИ, в основном состоящую из китайских исследователей. Руководитель команды — всего 28-летний Александр Ван, основавший Scale AI. В настоящее время оценка Scale AI составляет 29 миллиардов долларов, и она предоставляет данные для нескольких крупных ИИ-компаний, включая американские военные, OpenAI, Anthropic, Meta и других, а ее основная деятельность заключается в предоставлении большого объема точных аннотированных данных.
Scale AI выделяется среди множества единорогов, потому что она рано осознала ключевую роль данных в индустрии ИИ. Вычислительная мощность, модели и данные являются тремя основными столпами ИИ моделей. Если представить большую модель как человека, то модель — это тело, вычислительная мощность — это еда, а данные — это знания и информация.
В процессе быстрого развития больших языковых моделей акцент в отрасли изменился от моделей к вычислительной мощности. В настоящее время большинство моделей используют трансформеры в качестве основной структуры, время от времени появляются инновации, такие как MoE или MoRe; крупные компании либо создают свои суперкомпьютерные кластеры, либо подписывают долгосрочные контракты с облачными провайдерами для решения проблем вычислительной мощности. На этой основе важность данных становится все более очевидной.
Scale AI сосредоточена на создании прочной базы данных для AI моделей, их бизнес включает не только добычу существующих данных, но и генерацию данных. Компания также сформировала команду по обучению AI, состоящую из экспертов из различных областей, чтобы предоставить высококачественные тренировочные данные для моделей AI.
Обучение модели делится на два этапа: предварительное обучение и дообучение. Предварительное обучение похоже на процесс, когда ребенок учится говорить, и требует больших объемов текстовой информации, кода и т.д., собранной из Интернета. Дообучение похоже на школьное образование, имеющее четкие цели и направления, и направлено на развитие специфических способностей модели с помощью тщательно подобранных наборов данных.
Таким образом, в области данных AI основными являются два типа наборов данных: один тип - это большое количество данных, которые не требуют значительной обработки, обычно поступающих из платформ UGC, таких как Reddit, Twitter, Github, открытых литературных баз данных или частных баз данных компаний; другой тип - это данные, которые требуют тщательного проектирования и отбора, чтобы гарантировать развитие определенных способностей модели, что требует очистки данных, отбора, аннотирования и обратной связи от пользователей.
С увеличением возможностей моделей различные более точные и специализированные тренировочные данные станут ключевыми факторами, определяющими возможности моделей. В долгосрочной перспективе данные ИИ также представляют собой долгосрочную траекторию с эффектом снежного кома; по мере накопления предварительной работы данные будут обладать способностью к сложным процентам, и их ценность будет постоянно расти.
Web3 DataFi: Земной рай данных AI
В сравнении с командами из сотен тысяч удаленных ручных аннотаторов, созданными некоторыми компаниями в нескольких странах, Web3 имеет естественное преимущество в области данных AI, что дало начало новой концепции DataFi. В идеале преимущества Web3 DataFi включают:
Умные контракты обеспечивают суверенитет данных, безопасность и конфиденциальность
Естественное географическое арбитражное преимущество: свободная распределенная структура привлекает наиболее подходящую рабочую силу
Четкие преимущества стимулов и расчетов в блокчейне
Способствует созданию более эффективного и открытого рынка данных "под ключ".
Для обычных пользователей DataFi также является самым простым проектом децентрализованного ИИ для участия. Пользователи могут легко участвовать в проекте, выполнив простые действия, включая предоставление данных, оценку моделей, использование инструментов ИИ для простого творчества или участие в торговле данными и т.д.
Потенциальные проекты Web3 DataFi
В настоящее время несколько проектов DataFi получили значительное финансирование. Вот некоторые из представительных проектов:
Sahara AI: Стремится создать супер инфраструктуру и рынок для децентрализованного ИИ.
Yupp: Платформа обратной связи для моделей ИИ, собирающая отзывы пользователей о результатах работы моделей.
Vana: Преобразование личных данных пользователей в цифровые активы, которые можно монетизировать.
Chainbase: сосредоточен на данных блокчейна, охватывает более 200 блокчейнов.
Sapien: предназначен для массового преобразования человеческих знаний в качественные данные для обучения ИИ.
Prisma X: нацелен на то, чтобы стать открытым координационным уровнем для роботов.
Masa: Один из ведущих подсетевых проектов экосистемы Bittensor.
Irys: сосредоточен на программируемом хранении данных и вычислениях.
ORO: Дает возможность обычным людям участвовать в вкладе в ИИ.
Gata: позиционируется как децентрализованный уровень данных.
Эти проекты в настоящее время имеют низкие барьеры для входа, но как только они накапливают пользователей и экосистемную привязанность, преимущества платформы быстро накапливаются. Поэтому ранним проектам следует сосредоточиться на стимулирующих мерах и пользовательском опыте. В то же время, этим платформам также необходимо подумать о том, как управлять участниками и гарантировать качество данных, чтобы избежать ситуации "плохие деньги вытесняют хорошие".
Кроме того, повышение прозрачности является одной из главных проблем, с которыми сталкиваются современные проекты на блокчейне. Многие проекты все еще не имеют достаточных открытых и отслеживаемых данных, что неблагоприятно сказывается на долгосрочном здоровье развития Web3 DataFi.
Путь массового применения DataFi можно разделить на две части: первая - это привлечение достаточного количества индивидуальных пользователей для формирования силы сбора/генерации данных и потребителей AI-экономики; вторая - это получение признания со стороны основных предприятий, так как в краткосрочной перспективе они являются основным источником крупных объемов данных.
DataFi представляет собой долгосрочное развитие машинного интеллекта человеческим интеллектом, одновременно обеспечивая доходы от человеческого труда с помощью смарт-контрактов, в конечном итоге реализуя обратную связь машинного интеллекта с человеком. Для тех, кто испытывает неопределенность в эпоху ИИ или все еще питают идеалы блокчейна, участие в DataFi может стать разумным выбором.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
20 Лайков
Награда
20
6
Поделиться
комментарий
0/400
DogeBachelor
· 32м назад
Опять SaaS, будут играть для лохов. Надоели эти.
Посмотреть ОригиналОтветить0
NFTRegretful
· 3ч назад
ai еще действительно навалило данных, хаха, еще один раунд будут играть для лохов
Посмотреть ОригиналОтветить0
AirdropNinja
· 08-01 05:45
Опять хороший проект для неудачников, хе-хе
Посмотреть ОригиналОтветить0
LoneValidator
· 08-01 05:42
Да уж, богатство! В 28 лет уже 290 миллиардов.
Посмотреть ОригиналОтветить0
quiet_lurker
· 08-01 05:40
Данные на бирже стоят 29 миллиардов? Эти деньги слишком легко заработать.
Посмотреть ОригиналОтветить0
NotSatoshi
· 08-01 05:22
Если бы у кого-то было хотя бы половина такой яркости, было бы здорово~
DataFi: Новая голубая океан в экономике данных на основе ИИ в области Web3
Данные как актив: DataFi открывает новое голубое море
В этом месяце самым обсуждаемым вопросом в сфере ИИ является масштабный набор кадров компанией Meta, которая создала роскошную команду ИИ, в основном состоящую из китайских исследователей. Руководитель команды — всего 28-летний Александр Ван, основавший Scale AI. В настоящее время оценка Scale AI составляет 29 миллиардов долларов, и она предоставляет данные для нескольких крупных ИИ-компаний, включая американские военные, OpenAI, Anthropic, Meta и других, а ее основная деятельность заключается в предоставлении большого объема точных аннотированных данных.
Scale AI выделяется среди множества единорогов, потому что она рано осознала ключевую роль данных в индустрии ИИ. Вычислительная мощность, модели и данные являются тремя основными столпами ИИ моделей. Если представить большую модель как человека, то модель — это тело, вычислительная мощность — это еда, а данные — это знания и информация.
В процессе быстрого развития больших языковых моделей акцент в отрасли изменился от моделей к вычислительной мощности. В настоящее время большинство моделей используют трансформеры в качестве основной структуры, время от времени появляются инновации, такие как MoE или MoRe; крупные компании либо создают свои суперкомпьютерные кластеры, либо подписывают долгосрочные контракты с облачными провайдерами для решения проблем вычислительной мощности. На этой основе важность данных становится все более очевидной.
Scale AI сосредоточена на создании прочной базы данных для AI моделей, их бизнес включает не только добычу существующих данных, но и генерацию данных. Компания также сформировала команду по обучению AI, состоящую из экспертов из различных областей, чтобы предоставить высококачественные тренировочные данные для моделей AI.
Обучение модели делится на два этапа: предварительное обучение и дообучение. Предварительное обучение похоже на процесс, когда ребенок учится говорить, и требует больших объемов текстовой информации, кода и т.д., собранной из Интернета. Дообучение похоже на школьное образование, имеющее четкие цели и направления, и направлено на развитие специфических способностей модели с помощью тщательно подобранных наборов данных.
Таким образом, в области данных AI основными являются два типа наборов данных: один тип - это большое количество данных, которые не требуют значительной обработки, обычно поступающих из платформ UGC, таких как Reddit, Twitter, Github, открытых литературных баз данных или частных баз данных компаний; другой тип - это данные, которые требуют тщательного проектирования и отбора, чтобы гарантировать развитие определенных способностей модели, что требует очистки данных, отбора, аннотирования и обратной связи от пользователей.
С увеличением возможностей моделей различные более точные и специализированные тренировочные данные станут ключевыми факторами, определяющими возможности моделей. В долгосрочной перспективе данные ИИ также представляют собой долгосрочную траекторию с эффектом снежного кома; по мере накопления предварительной работы данные будут обладать способностью к сложным процентам, и их ценность будет постоянно расти.
Web3 DataFi: Земной рай данных AI
В сравнении с командами из сотен тысяч удаленных ручных аннотаторов, созданными некоторыми компаниями в нескольких странах, Web3 имеет естественное преимущество в области данных AI, что дало начало новой концепции DataFi. В идеале преимущества Web3 DataFi включают:
Для обычных пользователей DataFi также является самым простым проектом децентрализованного ИИ для участия. Пользователи могут легко участвовать в проекте, выполнив простые действия, включая предоставление данных, оценку моделей, использование инструментов ИИ для простого творчества или участие в торговле данными и т.д.
Потенциальные проекты Web3 DataFi
В настоящее время несколько проектов DataFi получили значительное финансирование. Вот некоторые из представительных проектов:
Sahara AI: Стремится создать супер инфраструктуру и рынок для децентрализованного ИИ.
Yupp: Платформа обратной связи для моделей ИИ, собирающая отзывы пользователей о результатах работы моделей.
Vana: Преобразование личных данных пользователей в цифровые активы, которые можно монетизировать.
Chainbase: сосредоточен на данных блокчейна, охватывает более 200 блокчейнов.
Sapien: предназначен для массового преобразования человеческих знаний в качественные данные для обучения ИИ.
Prisma X: нацелен на то, чтобы стать открытым координационным уровнем для роботов.
Masa: Один из ведущих подсетевых проектов экосистемы Bittensor.
Irys: сосредоточен на программируемом хранении данных и вычислениях.
ORO: Дает возможность обычным людям участвовать в вкладе в ИИ.
Gata: позиционируется как децентрализованный уровень данных.
Эти проекты в настоящее время имеют низкие барьеры для входа, но как только они накапливают пользователей и экосистемную привязанность, преимущества платформы быстро накапливаются. Поэтому ранним проектам следует сосредоточиться на стимулирующих мерах и пользовательском опыте. В то же время, этим платформам также необходимо подумать о том, как управлять участниками и гарантировать качество данных, чтобы избежать ситуации "плохие деньги вытесняют хорошие".
Кроме того, повышение прозрачности является одной из главных проблем, с которыми сталкиваются современные проекты на блокчейне. Многие проекты все еще не имеют достаточных открытых и отслеживаемых данных, что неблагоприятно сказывается на долгосрочном здоровье развития Web3 DataFi.
Путь массового применения DataFi можно разделить на две части: первая - это привлечение достаточного количества индивидуальных пользователей для формирования силы сбора/генерации данных и потребителей AI-экономики; вторая - это получение признания со стороны основных предприятий, так как в краткосрочной перспективе они являются основным источником крупных объемов данных.
DataFi представляет собой долгосрочное развитие машинного интеллекта человеческим интеллектом, одновременно обеспечивая доходы от человеческого труда с помощью смарт-контрактов, в конечном итоге реализуя обратную связь машинного интеллекта с человеком. Для тех, кто испытывает неопределенность в эпоху ИИ или все еще питают идеалы блокчейна, участие в DataFi может стать разумным выбором.