扫码下载 APP
qrCode
更多下载方式
今天不再提醒

科学家称物理思维是人工智能的主要障碍 - ForkLog: 加密货币, 人工智能, 奇点, 未来

机器人在水下,如何探索海底AI海床# 科学家称物理思维是人工智能的主要障碍

人工智能目前还无法完全理解物理世界。到目前为止,这是技术的主要问题,斯坦福大学计算机科学教授李飞飞说道。

“领先的人工智能技术,如大型语言模型(LLM),改变了我们获取和处理抽象知识的方式。然而,它们仍然只是名义上的专家:口才出众,但经验不足,虽然懂得,却缺乏依据,” — 他说。

根据科学家的观点,"空间智能"的出现将改变人们"创造和与真实及虚拟世界互动的方式,彻底改变文学、艺术、机器人技术、科学等领域。

创建这样的技术不仅需要在“语言”上训练模型,还需要在世界的物理特性上进行训练。

李声称,人工智能正在快速接近文本学习的能力极限,最终它的进步将取决于“世界模型”——一种新的生成式人工智能类型,它必须解决与LLM截然不同的一组任务。

AI的下一个前沿是空间智能,这是一项将视觉转化为推理、感知转化为行动以及想象转化为创造的技术。但它是什么?它为什么重要?我们如何构建它?我们又如何使用它?

今天,我想和你分享我的想法… pic.twitter.com/L0bnJcCUqc

— Fei-Fei Li (@drfeifei) 2025 年 11 月 10 日

“这些系统必须生成空间一致的世界,遵循物理法则,处理从图像到动作的多模态输入,并预测这些世界的发展,”李解释道。

根据教授的视野,空间智能是“超越语言的边界——创造联系的能力”。

世界模型的概念

概念出现在1940年代初期,源于苏格兰哲学家和心理学家肯尼斯·克雷克在认知科学领域的研究。

这个想法在2018年再次出现在现代人工智能领域,源于大卫·哈和尤尔根·施密德胡伯的一篇文章,文中提到神经网络可以学习并重建周围环境的紧凑内部模型,并将其用作规划和控制的模拟器。

然而,解决这个问题需要创建复杂的系统,这些系统能够存储空间记忆并在超过两个维度中建模场景。

在九月份,李氏公司World Labs发布了Marble的测试版——早期的“世界模型”,它通过文本或图形提示创建互动的三维环境。

用户可以在生成的环境中自由移动,时间和场景加载没有限制,环境保持统一,没有变化和崩溃。

Marble 作品的一个例子。资料来源:世界实验室。

"下一个人工智能发展的前沿将是空间智能——一种将视觉转化为推理、将感知转化为行动、将想象力转化为创造力的技术,"李说,并称Marble只是第一阶段。

提醒一下,在十月份,Nvidia推出了将量子计算机连接到公司AI芯片的系统。该技术将显著加快数据处理,并为医学和材料科学的研究开辟新的可能性。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)