掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

科學家稱物理思維是人工智能的主要障礙 - ForkLog: 加密貨幣, 人工智能, 奇點, 未來

機器人在水下,如何探索海底AI海牀# 科學家稱物理思維是人工智能的主要障礙

人工智能目前還無法完全理解物理世界。到目前爲止,這是技術的主要問題,斯坦福大學計算機科學教授李飛飛說道。

“領先的人工智能技術,如大型語言模型(LLM),改變了我們獲取和處理抽象知識的方式。然而,它們仍然只是名義上的專家:口才出衆,但經驗不足,雖然懂得,卻缺乏依據,” — 他說。

根據科學家的觀點,"空間智能"的出現將改變人們"創造和與真實及虛擬世界互動的方式,徹底改變文學、藝術、機器人技術、科學等領域。

創建這樣的技術不僅需要在“語言”上訓練模型,還需要在世界的物理特性上進行訓練。

李聲稱,人工智能正在快速接近文本學習的能力極限,最終它的進步將取決於“世界模型”——一種新的生成式人工智能類型,它必須解決與LLM截然不同的一組任務。

AI的下一個前沿是空間智能,這是一項將視覺轉化爲推理、感知轉化爲行動以及想象轉化爲創造的技術。但它是什麼?它爲什麼重要?我們如何構建它?我們又如何使用它?

今天,我想和你分享我的想法… pic.twitter.com/L0bnJcCUqc

— Fei-Fei Li (@drfeifei) 2025 年 11 月 10 日

“這些系統必須生成空間一致的世界,遵循物理法則,處理從圖像到動作的多模態輸入,並預測這些世界的發展,”李解釋道。

根據教授的視野,空間智能是“超越語言的邊界——創造聯繫的能力”。

世界模型的概念

概念出現在1940年代初期,源於蘇格蘭哲學家和心理學家肯尼斯·克雷克在認知科學領域的研究。

這個想法在2018年再次出現在現代人工智能領域,源於大衛·哈和尤爾根·施密德胡伯的一篇文章,文中提到神經網路可以學習並重建周圍環境的緊湊內部模型,並將其用作規劃和控制的模擬器。

然而,解決這個問題需要創建復雜的系統,這些系統能夠存儲空間記憶並在超過兩個維度中建模場景。

在九月份,李氏公司World Labs發布了Marble的測試版——早期的“世界模型”,它通過文本或圖形提示創建互動的三維環境。

用戶可以在生成的環境中自由移動,時間和場景加載沒有限制,環境保持統一,沒有變化和崩潰。

Marble 作品的一個例子。資料來源:世界實驗室。

"下一個人工智能發展的前沿將是空間智能——一種將視覺轉化爲推理、將感知轉化爲行動、將想象力轉化爲創造力的技術,"李說,並稱Marble只是第一階段。

提醒一下,在十月份,Nvidia推出了將量子計算機連接到公司AI芯片的系統。該技術將顯著加快數據處理,並爲醫學和材料科學的研究開闢新的可能性。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)