Anthropic révèle comment les entreprises chinoises d'IA volent des données à Claude pour créer leurs propres LLM !
Avant cela, je vous rappelle qu'il y a quelques jours, j'avais posté que, "En termes d'utilisation d'API, 4 des 5 principales entreprises d'IA dans le monde sont sous contrôle chinois. Les modèles d'IA chinois produisent des résultats proches de Claude et leurs coûts d'API sont environ 8-10 fois moins élevés. C'est pourquoi leurs modèles sont si largement utilisés à l'échelle de l'industrie." Mais comment ont-ils réussi cette capacité ?
Essayons d'en savoir plus.
DeepSeek, Moonshot AI (Kimi) et MiniMax accusent Anthropic d'avoir lancé une véritable attaque d'extraction industrielle sur le modèle Claude. Autrement dit, ils ont copié à l'identique les capacités avancées de Claude pour entraîner leurs propres modèles. Pour cela, ils ont créé près de 24 000 faux comptes et ont interagi avec Claude plus de 16 millions de fois. Leur objectif était de maîtriser le raisonnement avancé, le comportement agentique, les compétences en codage et l'utilisation d'outils de Claude.
DeepSeek a lancé une campagne de prompts à travers environ 150 000 interactions pour tenter de découvrir la logique interne ou le raisonnement étape par étape de Claude. Ils ont même utilisé Claude comme système de notation pour juger la sortie de leurs propres modèles ! D'autre part, Moonshot AI a effectué environ 3,4 millions d'interactions uniquement pour copier le raisonnement agentique et l'utilisation d'outils. Et MiniMax a été le plus agressif, avec près de 130 millions d'interactions, se concentrant principalement sur le codage et l'orchestration. Fait intéressant, lorsque Anthropic détecte et bloque leurs activités, ils migrent rapidement vers un nouveau modèle d'Anthropic et recommencent l'extraction de données.
Tout ce travail a été réalisé de manière très planifiée et décentralisée. Pour éviter la détection, ils ont utilisé des IP rotatives, des méthodes de paiement partagées et une activité synchronisée entre des milliers de comptes. La situation est telle qu'on parle maintenant de la plus grande campagne de distillation de modèles d'IA documentée à ce jour.
Le contexte géopolitique derrière est également très intéressant. Il y a quelques jours, OpenAI a averti le gouvernement américain par un mémo que les laboratoires chinois tentaient indirectement d'accéder aux modèles frontaliers américains.
Mais la question est : que vont-ils faire avec toutes ces données volées ? La réponse est qu'ils utiliseront les données avancées de Claude pour rendre leurs propres modèles plus puissants. Traiter cette énorme quantité de données nécessite d'énormes centres de données et superordinateurs, qui consomment beaucoup d'électricité. Fait surprenant, en 2025 seulement, la Chine a ajouté plus de 500 gigawatts de nouvelle capacité électrique, soit près de 10 fois plus que les États-Unis !
En d'autres termes, ils ont élaboré tout un plan pour extraire des données à partir des modèles américains d'IA et faire fonctionner leur infrastructure IA à l'échelle industrielle. Jusqu'à présent, aucun des trois entreprises chinoises d'IA accusées n'a nié publiquement le vol de données.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Anthropic révèle comment les entreprises chinoises d'IA volent des données à Claude pour créer leurs propres LLM !
Avant cela, je vous rappelle qu'il y a quelques jours, j'avais posté que, "En termes d'utilisation d'API, 4 des 5 principales entreprises d'IA dans le monde sont sous contrôle chinois. Les modèles d'IA chinois produisent des résultats proches de Claude et leurs coûts d'API sont environ 8-10 fois moins élevés. C'est pourquoi leurs modèles sont si largement utilisés à l'échelle de l'industrie." Mais comment ont-ils réussi cette capacité ?
Essayons d'en savoir plus.
DeepSeek, Moonshot AI (Kimi) et MiniMax accusent Anthropic d'avoir lancé une véritable attaque d'extraction industrielle sur le modèle Claude. Autrement dit, ils ont copié à l'identique les capacités avancées de Claude pour entraîner leurs propres modèles. Pour cela, ils ont créé près de 24 000 faux comptes et ont interagi avec Claude plus de 16 millions de fois. Leur objectif était de maîtriser le raisonnement avancé, le comportement agentique, les compétences en codage et l'utilisation d'outils de Claude.
DeepSeek a lancé une campagne de prompts à travers environ 150 000 interactions pour tenter de découvrir la logique interne ou le raisonnement étape par étape de Claude. Ils ont même utilisé Claude comme système de notation pour juger la sortie de leurs propres modèles ! D'autre part, Moonshot AI a effectué environ 3,4 millions d'interactions uniquement pour copier le raisonnement agentique et l'utilisation d'outils. Et MiniMax a été le plus agressif, avec près de 130 millions d'interactions, se concentrant principalement sur le codage et l'orchestration. Fait intéressant, lorsque Anthropic détecte et bloque leurs activités, ils migrent rapidement vers un nouveau modèle d'Anthropic et recommencent l'extraction de données.
Tout ce travail a été réalisé de manière très planifiée et décentralisée. Pour éviter la détection, ils ont utilisé des IP rotatives, des méthodes de paiement partagées et une activité synchronisée entre des milliers de comptes. La situation est telle qu'on parle maintenant de la plus grande campagne de distillation de modèles d'IA documentée à ce jour.
Le contexte géopolitique derrière est également très intéressant. Il y a quelques jours, OpenAI a averti le gouvernement américain par un mémo que les laboratoires chinois tentaient indirectement d'accéder aux modèles frontaliers américains.
Mais la question est : que vont-ils faire avec toutes ces données volées ? La réponse est qu'ils utiliseront les données avancées de Claude pour rendre leurs propres modèles plus puissants. Traiter cette énorme quantité de données nécessite d'énormes centres de données et superordinateurs, qui consomment beaucoup d'électricité. Fait surprenant, en 2025 seulement, la Chine a ajouté plus de 500 gigawatts de nouvelle capacité électrique, soit près de 10 fois plus que les États-Unis !
En d'autres termes, ils ont élaboré tout un plan pour extraire des données à partir des modèles américains d'IA et faire fonctionner leur infrastructure IA à l'échelle industrielle. Jusqu'à présent, aucun des trois entreprises chinoises d'IA accusées n'a nié publiquement le vol de données.