Comment Sapien réalise-t-il la mise à jour continue des données d'entraînement ?



I. Problème à long terme de l'entraînement de l'IA : les données ne sont pas une tâche unique.

Dans le processus traditionnel d'entraînement de l'IA, une fois qu'un ensemble de données d'entraînement est produit et utilisé, la tâche est considérée comme terminée et le rôle du contributeur prend fin. Le problème évident de ce modèle de données de type "consommation unique" est que les données d'entraînement manquent de mises à jour, ne peuvent pas s'adapter dynamiquement aux itérations du modèle, ce qui entraîne un plafonnement de la croissance des capacités du modèle. Dans un contexte où le savoir humain évolue constamment, si le modèle d'IA ne peut pas continuer à acquérir des données plus profondes, plus spécialisées et plus récentes, il sera difficile de faire face aux défis de l'intelligence générale.

Sapien tente de briser cette limitation en ne considérant pas les tâches de données comme des livraisons "par projet", mais en construisant un mécanisme d'évolution des données en continu, permettant aux données d'entraînement d'avoir un cycle de vie, un système de version et une capacité de maintenance dynamique.

Deuxièmement, comment assurer la mise à niveau continue des données ?

Le protocole Sapien est conçu avec un mécanisme en trois couches, garantissant que les données d'entraînement peuvent être mises à jour à long terme et que leur qualité évolue constamment :

(1) Mécanisme de version des tâches : Les tâches d'entraînement de la même catégorie génèrent régulièrement des versions telles que "v2", "v3", en fonction de la fréquence de mise à jour du modèle, pour attirer de anciens contributeurs à participer à nouveau, tout en introduisant de nouvelles perspectives et compléments, formant ainsi un ensemble d'entraînement itératif multiple ;

(2) Mécanisme de retour basé sur la réputation : le système propose des tâches de niveau supérieur ou des tâches de révision de données en fonction de l'historique et du poids de réputation de l'entraîneur, réalisant ainsi un mécanisme de "vieux qui entraîne les nouveaux" et "optimisation par des personnes dédiées" ;

(3) Boucle de rétroaction on-chain : grâce au mécanisme de feedback des utilisateurs du modèle, marquer automatiquement les segments de données qui ne donnent pas de bons résultats ou qui nécessitent une optimisation, pour les renvoyer dans le pool de formation des données, et inviter les contributeurs à rectifier et compléter.

Ces mécanismes garantissent que les données ne sont pas des livrables statiques, mais possèdent une capacité d'évolution dynamique en trois phases : « version - maintenance - mise à niveau ».

Troisième point, le nouveau rôle des mainteneurs de données : participants continus aux données d'entraînement.

Les mécanismes de Sapien ont transformé l'identité des travailleurs de données traditionnels. Les formateurs ne sont plus de simples fournisseurs de données à un stade donné, mais deviennent des "mainteneurs de données" et des "opérateurs d'actifs de connaissance" à long terme. Cela non seulement accroît leur valeur de participation et leur influence sur le système, mais permet également à la qualité des données de croître en rythme avec l'évolution même du protocole.

À long terme, ce modèle pourrait même donner naissance à une "chaîne de métiers de mise à niveau des données" dans le futur - comprenant divers rôles tels que les annotateurs, les vérificateurs, les optimiseurs, les coordinateurs de retour d'information, etc., formant ainsi un réseau de collaboration de travail intellectuel centré sur le cycle de vie des données.
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)