Un ancien ingénieur de la NASA et expert du cloud de Google explique pourquoi la construction d’un centre de données dans l’espace est une idée complètement irréaliste, difficile dans tous les domaines, de la dissipation de puissance et de chaleur à la tolérance aux radiations. Cet article est dérivé d’un article écrit par Taranis et a été compilé, compilé et écrit. (Synopsis : Cet homme veut envoyer une machine de minage de bitcoins dans l’espace : soleil illimité + frais de refroidissement zéro est la Mecque du minage de BTC) (Supplément de contexte : Déplacer le barrage des Trois Gorges dans l’espace) La Chine prévoit de construire une centrale solaire spatiale, et l’humanité accueillera la liberté énergétique ? Pour clarifier, je suis un ancien ingénieur/scientifique de la NASA avec un doctorat en électronique spatiale. Je suis également chez Google depuis 10 ans, travaillant dans diverses parties de l’entreprise, y compris YouTube et la division cloud responsable du déploiement de la puissance de calcul de l’IA, je suis donc bien qualifié pour parler de ce sujet. Pour le dire simplement : c’est une idée absolument terrible, et elle n’a vraiment aucun sens. Il y a de nombreuses raisons à cela, mais l’essentiel est que l’électronique nécessaire au fonctionnement des centres de données, en particulier ceux qui déploient la puissance de calcul de l’IA sous la forme de GPU et de TPU, est totalement inadaptée pour fonctionner dans l’espace. Si vous n’avez jamais travaillé dans ce domaine auparavant, je vous déconseille de faire des suppositions intuitives, car la réalité de faire fonctionner du matériel spatial dans l’espace n’est pas nécessairement évidente. La principale raison pour laquelle les gens veulent le faire semble être qu’il y a beaucoup d’électricité dans l’espace. Ce n’est pas le cas. En gros, vous n’avez que deux options : l’énergie solaire et l’énergie nucléaire. L’énergie solaire consiste à déployer un réseau de panneaux solaires équipés de cellules photoélectriques – en gros, l’équivalent d’un appareil sur le toit de ma maison en Irlande, juste dans l’espace. Cela fonctionne, mais ce n’est pas magiquement mieux que d’installer des panneaux solaires au sol - vous ne perdez pas autant d’électricité dans l’atmosphère, donc votre intuition sur la zone requise est à peu près juste. Le plus grand panneau solaire jamais déployé dans l’espace est le système de la Station spatiale internationale (ISS), qui fournit un peu plus de 200 kW de puissance à son apogée. Il est important de mentionner que le déploiement du système a nécessité plusieurs vols de navette spatiale et beaucoup de travail – il fait environ 2 500 mètres carrés, soit plus de la moitié de la taille d’un terrain de football américain. En utilisant le NVIDIA H200 comme référence, la puissance requise de chaque périphérique GPU est d’environ 0,7 kW par puce. Ceux-ci ne peuvent pas fonctionner seuls, et la conversion de puissance n’est pas efficace à 100 %, donc 1 kW par GPU pourrait en fait être un meilleur point de référence. En conséquence, un énorme réseau de la taille d’une ISS peut alimenter environ 200 GPU. Cela semble beaucoup, mais gardons un peu de perspective : le prochain centre de données d’OpenAI en Norvège est destiné à héberger 100 000 GPU, chacun probablement plus gourmand en énergie que le H200. Pour atteindre cette capacité, vous devez lancer 500 satellites de la taille d’ISS. En comparaison, un seul rack de serveur (comme les ventes préconfigurées de NVIDIA) contiendra 72 GPU, de sorte que chaque satellite géant n’équivaut qu’à environ trois racks. L’énergie nucléaire n’aidera pas non plus. Nous ne parlons pas ici de réacteurs nucléaires, mais de générateurs thermoélectriques à radio-isotopes (RTG), qui ont une puissance de sortie typique d’environ 50 W à 150 W. Il ne suffit donc même pas de faire fonctionner un seul GPU, même si vous pouvez convaincre quelqu’un de vous donner un morceau de plutonium sous-critique et que cela ne vous dérange pas que vous ayez des centaines de chances de le répandre sur une large zone lors du lancement d’un véhicule pour faire exploser son autodestruction. Système de contrôle thermique avancé de l’ISS (Boeing) J’ai vu pas mal de gens commenter le concept en disant : « Eh bien, l’espace est froid, donc le refroidissement sera facile, n’est-ce pas ? » Roter… Non… Pas vraiment. Le refroidissement sur Terre est relativement simple. La convection d’air fonctionne bien - laisser l’air souffler sur une surface, en particulier un dissipateur thermique conçu avec un grand rapport surface/volume, peut transférer la chaleur du dissipateur thermique à l’air assez efficacement. Si vous avez besoin d’une densité de puissance plus élevée que le refroidissement direct (et les GPU haute puissance entrent définitivement dans cette catégorie), vous pouvez utiliser le refroidissement liquide pour transférer la chaleur de la puce vers des dissipateurs thermiques plus grands/dissipateurs thermiques ailleurs. Dans les centres de données sur Terre, des cycles de refroidissement sont généralement mis en place, où les machines sont refroidies par du liquide de refroidissement (généralement de l’eau), qui est pompé autour du rack, extrayant la chaleur et renvoyant le liquide de refroidissement dans le cycle. Habituellement, le liquide de refroidissement est refroidi dans l’air par convection, donc de toute façon, c’est comme ça que ça marche sur Terre. Dans l’espace, il n’y a pas d’air. L’environnement est proche d’un vide absolu et il n’y a pas de différence pratique, de sorte que la convection ne se produit pas du tout. Lorsqu’il s’agit d’ingénierie spatiale, nous pensons généralement à la gestion thermique, et pas seulement au refroidissement. La vérité est que l’espace lui-même n’a pas de température. Seules les substances ont de la température. Cela peut vous surprendre, mais dans le système Terre-Lune, la température moyenne de presque tout est fondamentalement la même que la température moyenne de la Terre, parce que c’est pourquoi la Terre a cette température particulière. Si le satellite tournait, un peu comme du poulet sur un gril, il aurait tendance à maintenir une température à peu près constante similaire à la surface de la Terre. S’il ne tourne pas, le côté opposé au soleil se refroidira progressivement, environ 4 Kelvin en raison des limitations du fond diffus cosmologique, légèrement au-dessus du zéro absolu. Du côté ensoleillé, la situation peut devenir assez chaude, atteignant des centaines de degrés Celsius. Par conséquent, la gestion thermique nécessite une conception très minutieuse pour s’assurer que la chaleur est soigneusement dirigée vers l’endroit où elle doit aller. Parce qu’il n’y a pas de convection dans le vide, cela ne peut être réalisé que par conduction ou une sorte de pompe à chaleur. J’ai conçu du matériel spatial pour voler dans l’espace. Dans un cas particulier, j’ai conçu un système de caméra qui devait être très petit et léger, tout en offrant des capacités d’imagerie de niveau scientifique. La gestion thermique est au cœur du processus de conception. Cela doit être le cas, car l’énergie est rare pour les petits engins spatiaux, et la gestion thermique doit être réalisée tout en maintenant la masse au minimum. Donc, pour moi, il n’y a pas de pompe à chaleur ou de trucs sophistiqués : je suis allé dans l’autre direction et j’ai conçu le système pour qu’il consomme environ 1 watt en crête et descende à environ 10 % lorsque l’appareil photo est inactif. Toute cette électricité est convertie en chaleur, donc si je ne consomme que 1 watt lors de la capture d’une image, puis que j’éteins le capteur d’image dès que les données entrent dans la RAM, je peux réduire la consommation d’énergie de moitié, puis lorsque l’image est téléchargée sur l’ordinateur de vol, je peux désactiver la RAM, réduisant ainsi la puissance à un niveau relativement minuscule. La seule gestion thermique requise consiste à boulonner le bord de la carte au rack afin que les couches de cuivre à l’intérieur de la carte puissent transférer la chaleur générée. Refroidir ne serait-ce qu’un seul H200 serait un cauchemar absolu. Apparemment, le dissipateur thermique et le ventilateur ne fonctionneront pas du tout, mais il existe une version refroidie par liquide du H200. Supposons que cette version soit utilisée. Cette chaleur doit être transférée au dissipateur thermique - ce n’est pas comme le radiateur de votre voiture, rappelez-vous qu’il n’y a pas de convection ? Il a besoin de rayonner de la chaleur dans l’espace. Supposons que nous puissions le pointer loin du soleil. Le système de contrôle thermique actif (ATCS) de l’ISS est un exemple d’un tel système de contrôle thermique. Il s’agit d’un système très complexe qui utilise un circuit de refroidissement à l’ammoniac et un grand système de plaques rayonnantes. Il a une limite thermique de 16kW, soit environ 16 GPU H200, ce qui représente un peu plus d’un quart de rack au sol. Le système de panneaux de rayonnement thermique mesure 13,6 m x 3,12 m, soit environ 42,5 mètres carrés. Si l’on prend 200kW comme référence et que l’on suppose que toute cette puissance ira au GPU, on a besoin d’un système 12,5 fois plus grand, c’est-à-dire environ 531…
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Ancien ingénieur de la NASA : créer un centre de données spatiales est la pire idée que j'aie jamais entendue.
Un ancien ingénieur de la NASA et expert du cloud de Google explique pourquoi la construction d’un centre de données dans l’espace est une idée complètement irréaliste, difficile dans tous les domaines, de la dissipation de puissance et de chaleur à la tolérance aux radiations. Cet article est dérivé d’un article écrit par Taranis et a été compilé, compilé et écrit. (Synopsis : Cet homme veut envoyer une machine de minage de bitcoins dans l’espace : soleil illimité + frais de refroidissement zéro est la Mecque du minage de BTC) (Supplément de contexte : Déplacer le barrage des Trois Gorges dans l’espace) La Chine prévoit de construire une centrale solaire spatiale, et l’humanité accueillera la liberté énergétique ? Pour clarifier, je suis un ancien ingénieur/scientifique de la NASA avec un doctorat en électronique spatiale. Je suis également chez Google depuis 10 ans, travaillant dans diverses parties de l’entreprise, y compris YouTube et la division cloud responsable du déploiement de la puissance de calcul de l’IA, je suis donc bien qualifié pour parler de ce sujet. Pour le dire simplement : c’est une idée absolument terrible, et elle n’a vraiment aucun sens. Il y a de nombreuses raisons à cela, mais l’essentiel est que l’électronique nécessaire au fonctionnement des centres de données, en particulier ceux qui déploient la puissance de calcul de l’IA sous la forme de GPU et de TPU, est totalement inadaptée pour fonctionner dans l’espace. Si vous n’avez jamais travaillé dans ce domaine auparavant, je vous déconseille de faire des suppositions intuitives, car la réalité de faire fonctionner du matériel spatial dans l’espace n’est pas nécessairement évidente. La principale raison pour laquelle les gens veulent le faire semble être qu’il y a beaucoup d’électricité dans l’espace. Ce n’est pas le cas. En gros, vous n’avez que deux options : l’énergie solaire et l’énergie nucléaire. L’énergie solaire consiste à déployer un réseau de panneaux solaires équipés de cellules photoélectriques – en gros, l’équivalent d’un appareil sur le toit de ma maison en Irlande, juste dans l’espace. Cela fonctionne, mais ce n’est pas magiquement mieux que d’installer des panneaux solaires au sol - vous ne perdez pas autant d’électricité dans l’atmosphère, donc votre intuition sur la zone requise est à peu près juste. Le plus grand panneau solaire jamais déployé dans l’espace est le système de la Station spatiale internationale (ISS), qui fournit un peu plus de 200 kW de puissance à son apogée. Il est important de mentionner que le déploiement du système a nécessité plusieurs vols de navette spatiale et beaucoup de travail – il fait environ 2 500 mètres carrés, soit plus de la moitié de la taille d’un terrain de football américain. En utilisant le NVIDIA H200 comme référence, la puissance requise de chaque périphérique GPU est d’environ 0,7 kW par puce. Ceux-ci ne peuvent pas fonctionner seuls, et la conversion de puissance n’est pas efficace à 100 %, donc 1 kW par GPU pourrait en fait être un meilleur point de référence. En conséquence, un énorme réseau de la taille d’une ISS peut alimenter environ 200 GPU. Cela semble beaucoup, mais gardons un peu de perspective : le prochain centre de données d’OpenAI en Norvège est destiné à héberger 100 000 GPU, chacun probablement plus gourmand en énergie que le H200. Pour atteindre cette capacité, vous devez lancer 500 satellites de la taille d’ISS. En comparaison, un seul rack de serveur (comme les ventes préconfigurées de NVIDIA) contiendra 72 GPU, de sorte que chaque satellite géant n’équivaut qu’à environ trois racks. L’énergie nucléaire n’aidera pas non plus. Nous ne parlons pas ici de réacteurs nucléaires, mais de générateurs thermoélectriques à radio-isotopes (RTG), qui ont une puissance de sortie typique d’environ 50 W à 150 W. Il ne suffit donc même pas de faire fonctionner un seul GPU, même si vous pouvez convaincre quelqu’un de vous donner un morceau de plutonium sous-critique et que cela ne vous dérange pas que vous ayez des centaines de chances de le répandre sur une large zone lors du lancement d’un véhicule pour faire exploser son autodestruction. Système de contrôle thermique avancé de l’ISS (Boeing) J’ai vu pas mal de gens commenter le concept en disant : « Eh bien, l’espace est froid, donc le refroidissement sera facile, n’est-ce pas ? » Roter… Non… Pas vraiment. Le refroidissement sur Terre est relativement simple. La convection d’air fonctionne bien - laisser l’air souffler sur une surface, en particulier un dissipateur thermique conçu avec un grand rapport surface/volume, peut transférer la chaleur du dissipateur thermique à l’air assez efficacement. Si vous avez besoin d’une densité de puissance plus élevée que le refroidissement direct (et les GPU haute puissance entrent définitivement dans cette catégorie), vous pouvez utiliser le refroidissement liquide pour transférer la chaleur de la puce vers des dissipateurs thermiques plus grands/dissipateurs thermiques ailleurs. Dans les centres de données sur Terre, des cycles de refroidissement sont généralement mis en place, où les machines sont refroidies par du liquide de refroidissement (généralement de l’eau), qui est pompé autour du rack, extrayant la chaleur et renvoyant le liquide de refroidissement dans le cycle. Habituellement, le liquide de refroidissement est refroidi dans l’air par convection, donc de toute façon, c’est comme ça que ça marche sur Terre. Dans l’espace, il n’y a pas d’air. L’environnement est proche d’un vide absolu et il n’y a pas de différence pratique, de sorte que la convection ne se produit pas du tout. Lorsqu’il s’agit d’ingénierie spatiale, nous pensons généralement à la gestion thermique, et pas seulement au refroidissement. La vérité est que l’espace lui-même n’a pas de température. Seules les substances ont de la température. Cela peut vous surprendre, mais dans le système Terre-Lune, la température moyenne de presque tout est fondamentalement la même que la température moyenne de la Terre, parce que c’est pourquoi la Terre a cette température particulière. Si le satellite tournait, un peu comme du poulet sur un gril, il aurait tendance à maintenir une température à peu près constante similaire à la surface de la Terre. S’il ne tourne pas, le côté opposé au soleil se refroidira progressivement, environ 4 Kelvin en raison des limitations du fond diffus cosmologique, légèrement au-dessus du zéro absolu. Du côté ensoleillé, la situation peut devenir assez chaude, atteignant des centaines de degrés Celsius. Par conséquent, la gestion thermique nécessite une conception très minutieuse pour s’assurer que la chaleur est soigneusement dirigée vers l’endroit où elle doit aller. Parce qu’il n’y a pas de convection dans le vide, cela ne peut être réalisé que par conduction ou une sorte de pompe à chaleur. J’ai conçu du matériel spatial pour voler dans l’espace. Dans un cas particulier, j’ai conçu un système de caméra qui devait être très petit et léger, tout en offrant des capacités d’imagerie de niveau scientifique. La gestion thermique est au cœur du processus de conception. Cela doit être le cas, car l’énergie est rare pour les petits engins spatiaux, et la gestion thermique doit être réalisée tout en maintenant la masse au minimum. Donc, pour moi, il n’y a pas de pompe à chaleur ou de trucs sophistiqués : je suis allé dans l’autre direction et j’ai conçu le système pour qu’il consomme environ 1 watt en crête et descende à environ 10 % lorsque l’appareil photo est inactif. Toute cette électricité est convertie en chaleur, donc si je ne consomme que 1 watt lors de la capture d’une image, puis que j’éteins le capteur d’image dès que les données entrent dans la RAM, je peux réduire la consommation d’énergie de moitié, puis lorsque l’image est téléchargée sur l’ordinateur de vol, je peux désactiver la RAM, réduisant ainsi la puissance à un niveau relativement minuscule. La seule gestion thermique requise consiste à boulonner le bord de la carte au rack afin que les couches de cuivre à l’intérieur de la carte puissent transférer la chaleur générée. Refroidir ne serait-ce qu’un seul H200 serait un cauchemar absolu. Apparemment, le dissipateur thermique et le ventilateur ne fonctionneront pas du tout, mais il existe une version refroidie par liquide du H200. Supposons que cette version soit utilisée. Cette chaleur doit être transférée au dissipateur thermique - ce n’est pas comme le radiateur de votre voiture, rappelez-vous qu’il n’y a pas de convection ? Il a besoin de rayonner de la chaleur dans l’espace. Supposons que nous puissions le pointer loin du soleil. Le système de contrôle thermique actif (ATCS) de l’ISS est un exemple d’un tel système de contrôle thermique. Il s’agit d’un système très complexe qui utilise un circuit de refroidissement à l’ammoniac et un grand système de plaques rayonnantes. Il a une limite thermique de 16kW, soit environ 16 GPU H200, ce qui représente un peu plus d’un quart de rack au sol. Le système de panneaux de rayonnement thermique mesure 13,6 m x 3,12 m, soit environ 42,5 mètres carrés. Si l’on prend 200kW comme référence et que l’on suppose que toute cette puissance ira au GPU, on a besoin d’un système 12,5 fois plus grand, c’est-à-dire environ 531…