科學家稱物理思維是人工智能的主要障礙 - ForkLog: 加密貨幣, 人工智能, 奇點, 未來

Froklog

2025-11-11 16:01:08

# 科學家稱物理思維是人工智能的主要障礙

人工智能目前還無法完全理解物理世界。到目前爲止，這是技術的主要問題，斯坦福大學計算機科學教授李飛飛說道。

“領先的人工智能技術，如大型語言模型(LLM)，改變了我們獲取和處理抽象知識的方式。然而，它們仍然只是名義上的專家：口才出衆，但經驗不足，雖然懂得，卻缺乏依據，” — 他說。

根據科學家的觀點，"空間智能"的出現將改變人們"創造和與真實及虛擬世界互動的方式，徹底改變文學、藝術、機器人技術、科學等領域。

創建這樣的技術不僅需要在“語言”上訓練模型，還需要在世界的物理特性上進行訓練。

李聲稱，人工智能正在快速接近文本學習的能力極限，最終它的進步將取決於“世界模型”——一種新的生成式人工智能類型，它必須解決與LLM截然不同的一組任務。

AI的下一個前沿是空間智能，這是一項將視覺轉化爲推理、感知轉化爲行動以及想象轉化爲創造的技術。但它是什麼？它爲什麼重要？我們如何構建它？我們又如何使用它？

今天，我想和你分享我的想法… pic.twitter.com/L0bnJcCUqc

— Fei-Fei Li (@drfeifei) 2025 年 11 月 10 日

“這些系統必須生成空間一致的世界，遵循物理法則，處理從圖像到動作的多模態輸入，並預測這些世界的發展，”李解釋道。

根據教授的視野，空間智能是“超越語言的邊界——創造聯繫的能力”。

世界模型的概念

概念出現在1940年代初期，源於蘇格蘭哲學家和心理學家肯尼斯·克雷克在認知科學領域的研究。

這個想法在2018年再次出現在現代人工智能領域，源於大衛·哈和尤爾根·施密德胡伯的一篇文章，文中提到神經網路可以學習並重建周圍環境的緊湊內部模型，並將其用作規劃和控制的模擬器。

然而，解決這個問題需要創建復雜的系統，這些系統能夠存儲空間記憶並在超過兩個維度中建模場景。

在九月份，李氏公司World Labs發布了Marble的測試版——早期的“世界模型”，它通過文本或圖形提示創建互動的三維環境。

用戶可以在生成的環境中自由移動，時間和場景加載沒有限制，環境保持統一，沒有變化和崩潰。

Marble 作品的一個例子。資料來源：世界實驗室。

"下一個人工智能發展的前沿將是空間智能——一種將視覺轉化爲推理、將感知轉化爲行動、將想象力轉化爲創造力的技術，"李說，並稱Marble只是第一階段。

提醒一下，在十月份，Nvidia推出了將量子計算機連接到公司AI芯片的系統。該技術將顯著加快數據處理，並爲醫學和材料科學的研究開闢新的可能性。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

讚賞
點讚
留言
轉發
分享

留言

0/400

暫無留言

熱門話題查看更多
#CoinDesk11月報告Gate戰績來襲
1.5萬熱度
#廣場發幣瓜分千U獎池
9.11萬熱度
#XRP現貨ETF將上線
1.91萬熱度
#美停擺危機或將結束？
2.23萬熱度
#ETH反彈開啓，能否延續？
8560 熱度

熱門 Gate Fun查看更多

1
华夏华夏华夏
市值:$4104.02持有人數:2
0.04%
2
SHIP-USDTShrimp meat
市值:$4034.48持有人數:1
0.00%
3
loserloser
市值:$4044.82持有人數:1
0.00%
4
BDBeautifull Day
市值:$4037.93持有人數:1
0.00%
5
GGGold Gate
市值:$4086.2持有人數:1
0.00%