科学家称物理思维是人工智能的主要障碍 - ForkLog: 加密货币, 人工智能, 奇点, 未来

Froklog

2025-11-11 16:01:08

# 科学家称物理思维是人工智能的主要障碍

人工智能目前还无法完全理解物理世界。到目前为止，这是技术的主要问题，斯坦福大学计算机科学教授李飞飞说道。

“领先的人工智能技术，如大型语言模型(LLM)，改变了我们获取和处理抽象知识的方式。然而，它们仍然只是名义上的专家：口才出众，但经验不足，虽然懂得，却缺乏依据，” — 他说。

根据科学家的观点，"空间智能"的出现将改变人们"创造和与真实及虚拟世界互动的方式，彻底改变文学、艺术、机器人技术、科学等领域。

创建这样的技术不仅需要在“语言”上训练模型，还需要在世界的物理特性上进行训练。

李声称，人工智能正在快速接近文本学习的能力极限，最终它的进步将取决于“世界模型”——一种新的生成式人工智能类型，它必须解决与LLM截然不同的一组任务。

AI的下一个前沿是空间智能，这是一项将视觉转化为推理、感知转化为行动以及想象转化为创造的技术。但它是什么？它为什么重要？我们如何构建它？我们又如何使用它？

今天，我想和你分享我的想法… pic.twitter.com/L0bnJcCUqc

— Fei-Fei Li (@drfeifei) 2025 年 11 月 10 日

“这些系统必须生成空间一致的世界，遵循物理法则，处理从图像到动作的多模态输入，并预测这些世界的发展，”李解释道。

根据教授的视野，空间智能是“超越语言的边界——创造联系的能力”。

世界模型的概念

概念出现在1940年代初期，源于苏格兰哲学家和心理学家肯尼斯·克雷克在认知科学领域的研究。

这个想法在2018年再次出现在现代人工智能领域，源于大卫·哈和尤尔根·施密德胡伯的一篇文章，文中提到神经网络可以学习并重建周围环境的紧凑内部模型，并将其用作规划和控制的模拟器。

然而，解决这个问题需要创建复杂的系统，这些系统能够存储空间记忆并在超过两个维度中建模场景。

在九月份，李氏公司World Labs发布了Marble的测试版——早期的“世界模型”，它通过文本或图形提示创建互动的三维环境。

用户可以在生成的环境中自由移动，时间和场景加载没有限制，环境保持统一，没有变化和崩溃。

Marble 作品的一个例子。资料来源：世界实验室。

"下一个人工智能发展的前沿将是空间智能——一种将视觉转化为推理、将感知转化为行动、将想象力转化为创造力的技术，"李说，并称Marble只是第一阶段。

提醒一下，在十月份，Nvidia推出了将量子计算机连接到公司AI芯片的系统。该技术将显著加快数据处理，并为医学和材料科学的研究开辟新的可能性。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

0/400

暂无评论

热门话题查看更多
#CoinDesk11月报告Gate战绩来袭
1.5万热度
#广场发币瓜分千U奖池
9.11万热度
#XRP现货ETF将上线
1.9万热度
#美停摆危机或将结束？
2.23万热度
#ETH反弹开启，能否延续？
8560 热度

热门 Gate Fun查看更多

1
华夏华夏华夏
市值:$4104.02持有人数:2
0.04%
2
SHIP-USDTShrimp meat
市值:$4034.48持有人数:1
0.00%
3
loserloser
市值:$4044.82持有人数:1
0.00%
4
BDBeautifull Day
市值:$4037.93持有人数:1
0.00%
5
GGGold Gate
市值:$4086.2持有人数:1
0.00%