# Un scientifique a déclaré que la pensée physique était le principal obstacle pour l'IA
L'intelligence artificielle n'est pas encore capable de comprendre pleinement le monde physique. À ce jour, c'est le principal problème de la technologie, a déclaré la professeure d'informatique de l'Université de Stanford, Fei-Fei Li.
«Les technologies IA de pointe comme les grands modèles de langage (LLM) ont changé notre manière d'accéder à des connaissances abstraites et de travailler avec elles. Cependant, elles restent des maîtres seulement en paroles : éloquents, mais inexpérimentés, savants, mais non fondés», estime-t-il.
Selon le scientifique, l'émergence de « l'intelligence spatiale » changera la façon dont les gens « créent et interagissent avec les mondes réels et virtuels, révolutionnant la littérature, l'art, la robotique, la science et bien plus encore ».
La création d'une telle technologie nécessite d'entraîner des modèles non seulement sur le «langage», mais aussi sur les propriétés physiques du monde.
Li affirme que l'intelligence artificielle se rapproche rapidement des limites des capacités d'apprentissage par texte, et que, finalement, ses progrès dépendront des « modèles du monde » — un nouveau type d'IA générative qui doit résoudre un ensemble de tâches fondamentalement différent de celui des LLM.
La prochaine frontière de l'IA est l'intelligence spatiale, une technologie qui transformera la vision en raisonnement, la perception en action et l'imagination en création. Mais qu'est-ce que c'est ? Pourquoi est-ce important ? Comment le construisons-nous ? Et comment pouvons-nous l'utiliser ?
Aujourd'hui, je veux partager avec vous mes pensées sur… pic.twitter.com/L0bnJcCUqc
— Fei-Fei Li (@drfeifei) 10 novembre 2025
«De tels systèmes doivent générer des mondes spatialement cohérents, soumis aux lois physiques, traiter des données d'entrée multimodales — des images aux actions — et prédire le développement de ces mondes», a expliqué Li.
Selon la vision du professeur, l'intelligence spatiale représente « la frontière au-delà du langage — la capacité de créer des connexions ».
L'idée des « modèles du monde »
Le concept est apparu au début des années 1940 lors des recherches du philosophe et psychologue écossais Kenneth Craik dans le domaine des sciences cognitives.
L'idée a de nouveau émergé dans l'espace moderne de l'IA en 2018 après l'article de David Ha et Jürgen Schmidhuber selon lequel un réseau de neurones peut apprendre et recréer un modèle interne compact de l'environnement et l'utiliser comme simulateur pour la planification et le contrôle.
Cependant, la résolution du problème nécessite la création de systèmes complexes capables de stocker une mémoire spatiale et de modéliser des scènes dans plus de deux dimensions.
En septembre, la société Li, World Labs, a lancé la version bêta de Marble — un « modèle du monde » précoce qui créait des environnements tridimensionnels interactifs à l'aide d'instructions textuelles ou graphiques.
Les utilisateurs pouvaient se déplacer librement dans les environnements générés sans limites de temps ni chargement de scènes, et l'environnement restait cohérent, ne changeait pas et ne se décomposait pas.
Exemple de fonctionnement de Marble. Source : World Labs.
«La prochaine étape du développement de l'IA sera l'intelligence spatiale — une technologie qui transformera la vision en raisonnement, la perception en action et l'imagination en créativité», a déclaré Li, qualifiant Marble de seulement première étape.
Rappelons qu'en octobre, Nvidia a présenté un système pour connecter des ordinateurs quantiques aux puces IA de l'entreprise. Cette technologie accélérera considérablement le traitement des données et ouvrira de nouvelles possibilités pour la recherche en médecine et en science des matériaux.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Un scientifique a déclaré que la pensée physique est le principal obstacle pour l'IA - ForkLog : cryptomonnaies, IA, singularité, avenir
L'intelligence artificielle n'est pas encore capable de comprendre pleinement le monde physique. À ce jour, c'est le principal problème de la technologie, a déclaré la professeure d'informatique de l'Université de Stanford, Fei-Fei Li.
Selon le scientifique, l'émergence de « l'intelligence spatiale » changera la façon dont les gens « créent et interagissent avec les mondes réels et virtuels, révolutionnant la littérature, l'art, la robotique, la science et bien plus encore ».
La création d'une telle technologie nécessite d'entraîner des modèles non seulement sur le «langage», mais aussi sur les propriétés physiques du monde.
Li affirme que l'intelligence artificielle se rapproche rapidement des limites des capacités d'apprentissage par texte, et que, finalement, ses progrès dépendront des « modèles du monde » — un nouveau type d'IA générative qui doit résoudre un ensemble de tâches fondamentalement différent de celui des LLM.
Selon la vision du professeur, l'intelligence spatiale représente « la frontière au-delà du langage — la capacité de créer des connexions ».
L'idée des « modèles du monde »
Le concept est apparu au début des années 1940 lors des recherches du philosophe et psychologue écossais Kenneth Craik dans le domaine des sciences cognitives.
L'idée a de nouveau émergé dans l'espace moderne de l'IA en 2018 après l'article de David Ha et Jürgen Schmidhuber selon lequel un réseau de neurones peut apprendre et recréer un modèle interne compact de l'environnement et l'utiliser comme simulateur pour la planification et le contrôle.
Cependant, la résolution du problème nécessite la création de systèmes complexes capables de stocker une mémoire spatiale et de modéliser des scènes dans plus de deux dimensions.
En septembre, la société Li, World Labs, a lancé la version bêta de Marble — un « modèle du monde » précoce qui créait des environnements tridimensionnels interactifs à l'aide d'instructions textuelles ou graphiques.
Les utilisateurs pouvaient se déplacer librement dans les environnements générés sans limites de temps ni chargement de scènes, et l'environnement restait cohérent, ne changeait pas et ne se décomposait pas.
Exemple de fonctionnement de Marble. Source : World Labs.
Rappelons qu'en octobre, Nvidia a présenté un système pour connecter des ordinateurs quantiques aux puces IA de l'entreprise. Cette technologie accélérera considérablement le traitement des données et ouvrira de nouvelles possibilités pour la recherche en médecine et en science des matériaux.