#科学者は、物理的思考をAIの主な障害と呼んでいます人工知能はまだ物理的な世界を完全に理解する能力を持っていません。今日、これは技術の主要な問題であるとスタンフォード大学のコンピュータサイエンスの教授フェイ・フェイ・リーは述べました。> > 「大規模言語モデル(LLM)のような先進的なAI技術は、私たちが抽象的な知識にアクセスし、それを扱う方法を変えました。しかし、それらは言葉だけの達人であり、雄弁ではあるが経験が不足し、知識はあるものの根拠がない」と彼は考えています。> > > 科学者の見解によれば、「空間知能」の出現は、人々が「現実世界と仮想世界を創造し、相互作用する方法を変え、文学、芸術、ロボティクス、科学などに革命をもたらす」とのことです。そのような技術を作成するには、「言語」だけでなく、世界の物理的特性に基づいてモデルをトレーニングする必要があります。リーは、人工知能がテキスト学習の限界に急速に近づいていると主張しており、最終的にはその進歩が「世界モデル」に依存することになると述べています。これは、LLMとは根本的に異なる種類のタスクを解決する必要がある新しいタイプの生成的AIです。> AIの次のフロンティアは空間知能であり、これは見ることを推論に、知覚を行動に、想像を創造に変える技術です。しかし、それは何ですか?なぜ重要なのですか?どのように構築しますか?そして、どのように使用できますか?> > 今日は、…についての私の考えを共有したいと思います pic.twitter.com/L0bnJcCUqc> > — Fei-Fei Li (@drfeifei) 2025年11月10日> >「このようなシステムは、物理法則に従う空間的に整合した世界を生成し、画像から行動までの多様な入力データを処理し、これらの世界の発展を予測する必要があります」とリーは説明しました。> > > 教授のビジョンによれば、空間知性は「言語の外側の境界 — 相互関係を作り出す能力」を表しています。## **世界モデルのアイデア**この概念は、1940年代初頭にスコットランドの哲学者であり心理学者であるケネス・クレイクによる認知科学の研究の中で登場しました。このアイデアは、2018年にデビッド・ハーとユルゲン・シュミットフーバーの論文の後に現代のAI空間で再び浮上しました。この論文では、ニューラルネットワークが周囲の環境のコンパクトな内部モデルを学習し再現し、それを計画と制御のためのシミュレーターとして使用できることが示されています。しかし、この課題を解決するには、空間的な記憶を保持し、二次元以上でシーンをモデル化できる複雑なシステムを作成する必要があります。9月にLi社のWorld Labsは、テキストまたはグラフィックのヒントを使用してインタラクティブな3D環境を生成する初期の「世界モデル」であるMarbleのベータ版をリリースしました。ユーザーは、生成された環境を時間やシーンの読み込みの制限なしに移動でき、環境は一貫しており、変わることも崩れることもありませんでした。マーブルの作品の一例。出典:World Labs。> > 「次のAIの発展の境界は空間知能になります。これは、視覚を推論に、知覚を行動に、想像を創造に変える技術です」とリーは述べ、Marbleを最初のステップに過ぎないと呼びました。> > > 改めて、10月にNvidiaは量子コンピュータを同社のAIチップに接続するためのシステムを発表しました。この技術はデータ処理を大幅に加速し、医学や材料科学の研究に新しい可能性を開くでしょう。
科学者は、物理的思考がAIにとって最大の障害であると述べた - ForkLog:暗号通貨、AI、シンギュラリティ、未来
人工知能はまだ物理的な世界を完全に理解する能力を持っていません。今日、これは技術の主要な問題であるとスタンフォード大学のコンピュータサイエンスの教授フェイ・フェイ・リーは述べました。
科学者の見解によれば、「空間知能」の出現は、人々が「現実世界と仮想世界を創造し、相互作用する方法を変え、文学、芸術、ロボティクス、科学などに革命をもたらす」とのことです。
そのような技術を作成するには、「言語」だけでなく、世界の物理的特性に基づいてモデルをトレーニングする必要があります。
リーは、人工知能がテキスト学習の限界に急速に近づいていると主張しており、最終的にはその進歩が「世界モデル」に依存することになると述べています。これは、LLMとは根本的に異なる種類のタスクを解決する必要がある新しいタイプの生成的AIです。
教授のビジョンによれば、空間知性は「言語の外側の境界 — 相互関係を作り出す能力」を表しています。
世界モデルのアイデア
この概念は、1940年代初頭にスコットランドの哲学者であり心理学者であるケネス・クレイクによる認知科学の研究の中で登場しました。
このアイデアは、2018年にデビッド・ハーとユルゲン・シュミットフーバーの論文の後に現代のAI空間で再び浮上しました。この論文では、ニューラルネットワークが周囲の環境のコンパクトな内部モデルを学習し再現し、それを計画と制御のためのシミュレーターとして使用できることが示されています。
しかし、この課題を解決するには、空間的な記憶を保持し、二次元以上でシーンをモデル化できる複雑なシステムを作成する必要があります。
9月にLi社のWorld Labsは、テキストまたはグラフィックのヒントを使用してインタラクティブな3D環境を生成する初期の「世界モデル」であるMarbleのベータ版をリリースしました。
ユーザーは、生成された環境を時間やシーンの読み込みの制限なしに移動でき、環境は一貫しており、変わることも崩れることもありませんでした。
マーブルの作品の一例。出典:World Labs。
改めて、10月にNvidiaは量子コンピュータを同社のAIチップに接続するためのシステムを発表しました。この技術はデータ処理を大幅に加速し、医学や材料科学の研究に新しい可能性を開くでしょう。