OpenAI vers la gauche DeepSeek vers la droite

24 avril 2026, DeepSeek V4 version bêta officielle.

Cette grande modèle nationale, comprenant la version Pro de 16 000 milliards de paramètres et la version Flash de 284 milliards de paramètres, a mis en avant ses atouts principaux sur le marché, avec un contexte de million de tokens, devenant la configuration standard gratuite pour tous les services officiels.

Presque en même temps, de l’autre côté de l’océan, OpenAI a également lancé GPT-5.5. Sa puissance de calcul est plus grande, ses fonctionnalités d’Agent plus riches, mais son prix est aussi beaucoup plus élevé.

« Contexte d’un million » traduit en langage courant, signifie que l’IA n’est plus une « poisson rouge » qui ne peut se souvenir que de vos quelques dernières phrases, mais devient un « super cerveau » capable d’engloutir d’un seul coup trois tomes de « Trois Corps », de comprendre en une seconde un film de deux heures, et même de vous aider à repérer les fautes de frappe.

Prenons un exemple simple : vous pouvez confier à V4 tous les contrats, emails, rapports financiers des trois dernières années de votre entreprise, et il vous aidera à repérer la clause de violation de contrat dissimulée dans l’annexe de la page 47. Avant, cela nécessitait une équipe d’avocats ; maintenant, c’est gratuit.

GPT-5.5 facture ce genre de super cerveau à un prix fixe : 5 dollars par million de tokens d’entrée, 30 dollars pour la sortie ; tandis que la version Pro, destinée aux tâches avancées, atteint des prix exorbitants de 30 dollars par million de tokens d’entrée et 180 dollars pour la sortie.

Mais selon le tarif officiel de DeepSeek, une entrée en cache hit dans V4-Flash coûte seulement 0,2 yuan RMB par million de tokens, et la sortie 2 yuan ; même pour V4-Pro, qui rivalise avec les modèles fermés de haut niveau, une entrée en cache hit coûte 1 yuan, une entrée en cache miss 12 yuan, et la sortie seulement 24 yuan.

Tout le monde pense que la compétition IA entre la Chine et les États-Unis est une course de capacités de modèles, mais en réalité, cela s’est depuis longtemps transformé en une divergence de modèles commerciaux.

OpenAI, autrefois le jeune dragon clamant « faire le bien de toute l’humanité », vend aujourd’hui des produits haut de gamme coûteux ; tandis que DeepSeek, utilisant une puissance de calcul presque gratuite, transforme l’IA en eau, électricité et gaz.

Quand OpenAI devient un entrepreneur rusé, pourquoi DeepSeek dépense-t-il sans compter pour transformer l’IA de pointe en une ressource gratuite comme l’eau courante ? Derrière ce transfert de pouvoir de fixation des prix, quels courants souterrains se cachent ?

Le vent froid de Ulanqab

La bataille décisive pour les grands modèles se joue dans une salle serveur en Mongolie intérieure, à moins 20 degrés.

Juste avant la sortie de V4, une demande de recrutement inattendue est apparue chez DeepSeek : un poste de chef de livraison senior pour le centre de données et un ingénieur de maintenance senior, avec un salaire maximum de 30 000 RMB par mois, 14 mois, basé à Ulanqab, Mongolie intérieure.

C’était une entreprise qui se targuait autrefois de « minimalisme, pureté, uniquement algorithmes ».

Au cours des deux dernières années, leur étiquette la plus fière était « deux livres pour en faire mille » : avec moins de 6 millions de dollars de coût d’entraînement, ils ont créé DeepSeek-R1, qui a fait plonger le secteur de l’IA en bourse américaine.

Mais la demande énorme en puissance de calcul de V4, combinée aux sanctions américaines de plus en plus strictes sur le calcul, a complètement brisé cette utopie légère.

En 2025, le Département du Commerce américain a encore renforcé le contrôle des exportations de puces IA vers la Chine, Nvidia H100 et H800 ont été coupés, même la version dégradée H20 a été placée sur la liste de contrôle. Cela signifie que l’expansion future de la puissance de calcul de DeepSeek doit désormais se tourner entièrement vers l’écosystème Huawei Ascend.

Dans le communiqué de lancement de V4, l’équipe officielle indique que le nouveau modèle bénéficie du « soutien de Huawei Ascend », et révèle qu’après la mise sur le marché en masse du super-nœud Ascend 950 en seconde moitié d’année, le prix du Pro sera fortement réduit.

Ce changement ne peut pas simplement se faire en modifiant quelques lignes dans le code d’adaptation ; il faut repartir de zéro, construire une infrastructure complète de puissance de calcul nationale au niveau physique.

La taille de V4, avec ses 1,1 trillion de paramètres (données pré-entraînées atteignant 33 trillions de tokens), et ses énormes besoins en calcul pour le contexte de million, signifie qu’il faut des milliers de puces Ascend, des salles capables de les accueillir, un réseau électrique pour alimenter ces salles, et une équipe de maintenance capable de faire fonctionner ces machines dans le froid de -20°C sans panne.

Liang Wenfeng a appliqué sa méthodologie du monde des bits à celui des atomes.

La puissance de calcul doit finalement s’enraciner dans le béton armé et les lignes électriques.

D’un côté, des élites en IA en chemise à carreaux à Silicon Valley, tapant du code en buvant un café filtre ; de l’autre, des opérateurs en manteaux militaires dans les plaines de Mongolie intérieure, surveillant les centres de données. Cette différence constitue la toile de fond de la résistance chinoise à la coupure de la puissance de calcul.

Se transformer d’une entreprise purement algorithmique en un « acteur à actifs lourds » construisant ses propres centres de données signifie que DeepSeek abandonne l’ère de la guérilla « petite mais miraculeuse », pour enfiler l’armure du soldat lourd.

Ce changement a un coût énorme : construire des centres, acheter des puces, tirer des câbles, chaque étape est un gouffre sans fond. Plus important encore, ce modèle à actifs lourds entraîne une augmentation exponentielle des coûts d’exploitation, alors que les revenus commerciaux de DeepSeek restent très limités.

Cette stratégie de tarification revient à compenser la perte par l’écosystème, à échanger la gratuité contre la maîtrise de l’infrastructure.

Un héros qui a toujours refusé tous les géants, qui finance lui-même l’IA par le trading quantitatif, combien de temps pourra-t-il tenir face à ce gouffre sans fond ?

Un compromis de 20 milliards de dollars

En avril, DeepSeek a annoncé le lancement de sa première levée de fonds externe, avec une valorisation estimée à 3000 milliards de RMB (environ 440 milliards de dollars), visant à lever 50 milliards, dont 30 milliards auprès d’investisseurs extérieurs. Des rumeurs évoquent une compétition entre Tencent et Alibaba pour entrer dans le tour.

Beaucoup pensent que c’est parce que construire des centres coûte trop cher. Mais en réalité, la principale motivation de cette levée n’est pas seulement l’achat de GPU, mais aussi « une idéologie technique pure » : face à la machine à tuer des talents des géants, ils ne peuvent pas résister.

Pendant la phase critique du développement de V4, les grandes entreprises nationales ont lancé une chasse ciblée effrénée pour recruter DeepSeek. Depuis la seconde moitié de 2025, au moins 5 membres clés de l’équipe de R&D ont quitté. Le principal auteur du premier modèle, Wang Bingxuan, est allé chez Tencent ; la contributrice clé de V3, Luo Fuli, a été recrutée par Lei Jun avec un salaire annuel de plusieurs millions, chez Xiaomi ; et le principal auteur de R1, Guo Daya, a rejoint l’équipe Seed de ByteDance.

C’est la façon la plus crue de faire fonctionner le marché : quand votre concurrent détient une armée de munitions infinies, et que vous utilisez votre propre argent pour maintenir la machine en marche, le marché du talent devient votre faiblesse la plus vulnérable.

Vous pouvez demander à des génies de faire des heures supplémentaires à salaire réduit pour changer le monde, mais quand une grande entreprise pose une chèquede dizaines de millions en cash et en options sur la table, et promet une puissance de calcul infinie, la capacité de fixer les prix de l’idéalisme vous échappe.

Le dilemme de Liang Wenfeng est en fait celui de tout entrepreneur chinois tentant de faire une « entreprise lente » : dans un marché où les grands peuvent tout acheter avec de l’argent, la voie « sans financement, sans commercialisation, uniquement technique » est extrêmement luxueuse. Son prix, c’est accepter que son équipe puisse être évincée à tout moment par ses concurrents.

Ce tour de financement à 3000 milliards n’est pas une concession de Liang Wenfeng au capital, mais une guerre pour préserver la composition de l’équipe de R&D de V4, en lançant une guerre de rachat de personnel. Il doit s’asseoir à la table du capital, avec de l’argent liquide, pour donner aux membres restants une raison valable de rester.

L’éventualité que Tencent ou Alibaba entrent en scène signifie que DeepSeek ne sera plus ce héros solitaire, purement idéologique, de la technologie. Elle devient une entreprise avec des actionnaires externes, sous pression commerciale. La liberté de recherche, autrefois la fierté de Liang Wenfeng, sera inévitablement diluée.

Mais il n’a pas le choix.

Quand l’idéalisme doit enfiler l’armure du capital, d’où vient la confiance pour faire fonctionner cette machine gigantesque, et faire tourner la salle de Ulanqab jour et nuit ?

Une autre « grande force, miracle garanti »

La réponse ne se trouve pas dans l’algorithme, mais dans le réseau électrique.

Ce qui préoccupe le plus la Silicon Valley aujourd’hui, ce n’est pas le manque de puces, mais l’électricité. Elon Musk construit frénétiquement un super centre de données à Memphis, Tennessee, OpenAI envisage même d’investir dans une centrale nucléaire, et Microsoft a annoncé la relance de la centrale de Three Mile Island en Pennsylvanie pour alimenter ses centres de données IA. La limite de la puissance de calcul, c’est l’électricité, une vérité physique glaciale.

Aux États-Unis, la consommation électrique d’un grand centre de données IA équivaut à celle d’une ville moyenne. Mais le réseau électrique américain, vieux de plus de 70 ans, est lent à se développer, fragmenté régionalement, incapable de suivre la rythme d’expansion de la puissance de calcul de l’ère IA.

Et ce qui soutient la course chinoise à l’IA face aux États-Unis, ce ne sont pas seulement ces génies de l’algorithme avec des salaires de plusieurs millions, mais aussi ces lignes de transmission à haute tension, souvent invisibles.

Le centre de données de Ulanqab, par exemple, s’appuie sur l’abondance d’électricité verte en Mongolie intérieure, et sur la capacité de gestion du réseau électrique chinois, la première au monde. Selon des données publiques, la capacité installée d’électricité verte à Ulanqab atteint 19,4 GW, représentant environ 65,9 %, avec un coût inférieur d’environ 50 % à celui de l’est du pays. De plus, avec une température annuelle moyenne de seulement 4,3°C, la période de refroidissement naturel dure près de 10 mois, permettant d’économiser 20 à 30 % d’énergie.

Lorsque V4 de DeepSeek fonctionne, c’est l’immense et très bon marché réseau électrique chinois qui lui fournit la « transfusion » nécessaire. C’est une autre dimension du « miracle garanti ».

Il y a une comparaison historique à la fois fascinante et cruelle : en 1986, les États-Unis ont utilisé l’« Accord semi-conducteurs USA-Japon » pour écraser l’industrie japonaise, forçant le Japon à ouvrir ses marchés et à accepter des contrôles de prix. La part de marché mondiale des semi-conducteurs japonais est passée de 40 % en 1986 à 15 % en 2011. Le Japon n’a pas réussi à se relever en trente ans.

Aujourd’hui, les États-Unis tentent d’utiliser la même logique pour bloquer la développement de l’IA chinoise, en coupant l’accès aux puces, en limitant la puissance de calcul, et en coupant la chaîne d’approvisionnement technologique. Mais la contre-attaque chinoise est totalement différente.

L’échec du Japon à l’époque résidait dans sa dépendance extrême à la technologie et au marché américains pour ses semi-conducteurs. Une fois coupé, il perdait toute capacité d’indépendance. La riposte chinoise, elle, commence par la reconstruction de ses infrastructures physiques fondamentales : fabriquer ses propres puces, construire ses propres centres de données, tirer ses propres lignes électriques, ouvrir ses modèles.

C’est une voie extrêmement lourde, coûteuse, mais aussi très difficile à « tuer ». Pendant que la Silicon Valley construit des tours de Babel dans le cloud, la Chine creuse des tranchées dans la terre.

Si la lutte pour la puissance de calcul dans le cloud est une guerre d’usure extrêmement brutale, avec la construction de centres en Mongolie intérieure et le déploiement de câbles électriques, n’y a-t-il pas une autre voie pour échapper à la domination du cloud ?

Fuir le cloud

Alors que les géants de la Silicon Valley construisent des centres de données de plus en plus grands, voire planifient des clusters de puissance de calcul à plusieurs milliards de dollars comme OpenAI, la contre-attaque chinoise se déplace discrètement sous terre.

L’arme ultime contre le blocage américain de la puissance de calcul n’est pas de fabriquer des puces plus puissantes que le H100, mais d’intégrer de grands modèles dans chaque téléphone.

Puisque nous ne pouvons pas rivaliser dans le cloud avec une puissance de feu écrasante, ramenons le champ de bataille aux 1,4 milliard de smartphones et appareils en périphérie. C’est une tactique de guérilla typique, très difficile à bloquer : on peut interdire l’exportation de GPU haut de gamme, mais on ne peut pas confisquer tous les téléphones dans la poche de chaque Chinois.

En 2026, avec l’angoisse de la puissance de calcul déclenchée par DeepSeek, les fabricants chinois Xiaomi, OPPO, vivo ont lancé une « migration vers le périphérique ». Ils ne se contentent plus de faire des smartphones qui ne sont que des écrans pour accéder aux API cloud, mais intègrent par distillation et compression extrêmes un « super cerveau » réduit, directement dans des téléphones à quelques milliers de yuans.

La clé de cette stratégie est la « distillation » : en termes simples, utiliser un grand modèle (enseignant) pour entraîner un petit modèle (élève), afin que ce dernier apprenne la « façon de penser » du professeur, plutôt que de simplement mémoriser toutes ses « connaissances ».

Grâce à une distillation et une quantification extrêmes, un grand modèle qui nécessitait des centaines de GPU pour fonctionner peut être compressé à seulement 1,2 à 2,5 GB, et fonctionner en douceur sur une puce de téléphone.

Des applications mobiles comme MNN Chat permettent déjà aux utilisateurs d’exécuter localement sur leur téléphone le modèle distillé DeepSeek R1. L’intérêt de cette IA en périphérie, c’est que vous n’avez pas besoin d’une connexion 5G constante, ni de payer 100 dollars par mois à la Silicon Valley. Le grand modèle est dans votre poche, il fonctionne hors ligne, et vous n’avez pas à dépenser un centime pour la puissance de calcul dans le cloud.

Puisque je ne peux pas construire de gigantesque centrale de chauffage, je distribue un petit poêle à chaque foyer.

Bien sûr, l’IA en périphérie n’est pas parfaite. Limitée par la puissance de calcul et la mémoire des téléphones, ses capacités sont bien inférieures à celles des grands modèles cloud. Elle peut vous aider à rédiger un email, traduire un texte, résumer un article, mais pour déduire un théorème mathématique complexe ou analyser un contrat juridique de plusieurs centaines de pages, elle reste limitée.

Mais cela suffit déjà. Pour la majorité des gens, l’IA dont ils ont besoin n’est pas un super cerveau capable de déduire des théorèmes, mais un « assistant personnel » capable de gérer leurs tâches quotidiennes.

Quand les grands modèles deviennent si bon marché qu’ils peuvent tenir dans une poche, comment changeront-ils ces coins oubliés par Silicon Valley ?

L’équité numérique dans le Sud global

Si vous êtes dans un bureau en verre à Manhattan, vous pensez probablement que faire grimper GPT-5.5 à 100 dollars est justifié, car il peut rédiger en une seconde un rapport financier de fusion-acquisition parfait.

Mais si vous êtes dans un champ de maïs en Ouganda, face à des cultures jaunies par le changement climatique, personne ne peut payer 100 dollars d’abonnement, car le revenu mensuel par habitant en Ouganda est inférieur à 150 dollars.

Les géants de la Silicon Valley discutent de comment dominer le monde avec l’IA, mais les agriculteurs ougandais et les étudiants pauvres d’Asie du Sud-Est, grâce à l’open source de DeepSeek, entrent pour la première fois dans l’ère numérique.

GPT-5.5 sert ceux qui peuvent payer, et son corpus est presque entièrement en anglais. Si vous lui posez une question en swahili ou en javanais, il répondra maladroitement, et consommera plusieurs fois plus de tokens qu’en anglais. Les géants de la Silicon Valley, en raison du « faible retour sur investissement », abandonnent volontairement ces marchés marginaux.

Et les modèles open source chinois deviennent l’infrastructure numérique du Sud global.

En Ouganda, l’ONG Sunbird AI, en utilisant le modèle chinois open source Qwen, a affiné le système Sunflower, qui supporte désormais 31 langues locales, contre 6 auparavant. Ce système est déployé dans le système d’agriculture du gouvernement ougandais, envoyant des conseils agricoles en swahili aux fermiers.

En Malaisie, des entreprises technologiques ont affiné des modèles IA conformes à la charia, supportant le malais et l’indonésien, tout en respectant les normes religieuses et culturelles du marché musulman. De l’identité numérique en Indonésie aux questions médicales en swahili au Kenya, la technologie chinoise s’infiltre dans la société de ces pays.

La plateforme d’API d’IA la plus grande au monde, OpenRouter, a publié début 2026 que la consommation de tokens des modèles chinois y dépassait pour la première fois celle de ses concurrents américains. Sur une semaine donnée, les 10 modèles les plus populaires ont consommé 87 000 milliards de tokens, dont environ 61 % par des modèles chinois.

L’open source brise le monopole américain sur la parole de l’IA, permettant aux pays en développement, en manque de ressources, de franchir le fossé numérique. Ce n’est pas une grande narration de compétition sino-américaine, mais une véritable « campagne rurale pour encercler la ville » dans l’ère de l’IA.

La stratégie chinoise d’open source devient, objectivement, une forme très efficace de « soft power ». Quand les géants de la Silicon Valley construisent des murailles dans le cloud pour devenir les nouveaux seigneurs numériques, ceux qui ne peuvent pas payer le loyer trouvent enfin leur propre étincelle dans la terre de l’open source et du périphérique.

L’eau courante

La technologie ne devrait jamais être un luxe inaccessible.

La Silicon Valley a construit des immeubles de luxe, avec un contrôle d’accès strict, réservé aux VIP. Mais nous avons creusé une canalisation d’eau potable pour des millions de foyers.

Cette canalisation commence dans une salle serveur en Mongolie intérieure à -20°C, dans le grondement des lignes à haute tension, dans la guerre pour une valorisation de 300 milliards. Chaque segment est lourd, coûteux, rempli de compromis et de contraintes. Liang Wenfeng voulait créer une entreprise purement technologique, mais la réalité l’a forcé à construire des centres, à financer, à se battre pour le recrutement. Il n’avait pas le choix : il a choisi un chemin plus difficile, faire de l’IA une ressource comme l’eau courante, pas un luxe.

Et cette canalisation se termine dans un smartphone chinois à quelques milliers de yuans, dans les mains rugueuses d’un fermier ougandais, dans la vie de chaque personne souhaitant franchir le fossé numérique.

Aussi haut que soit la muraille de la puissance de calcul, elle ne peut pas arrêter l’eau qui coule vers le bas.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler