广场
最新
热门
资讯
我的主页
发布
Happy_Bird
2026-03-07 07:29:34
关注
#OpenAIReleasesGPT-5.4
OpenAI 已正式推出 GPT-5.4,这是其前沿人工智能模型的最新演进。此次发布标志着人工智能能力的重大飞跃,特别是在专业工作、自动化、编码和大规模推理任务方面。GPT-5.4 现已在 ChatGPT、开发者 API 和 Codex 中逐步推出,将其定位为目前为企业、开发者和知识工作者提供的最先进的 AI 系统之一。
与早期主要关注对话质量的更新不同,GPT-5.4 专为在软件工具、文档、电子表格和复杂工作流程中执行实际任务而设计。该模型集成了推理、编码、计算机交互和长上下文记忆的改进,使其能够更高效、更准确地完成多步骤任务。
以下是 GPT-5.4 引入的主要功能的逐步说明。
1. GPT-5.4“思考”模式的引入
最引人注目的一项新增功能是 GPT-5.4 思考模式,这是一个以推理为重点的模型版本,旨在处理复杂的分析工作。
此模式允许 AI 在生成最终答案之前制定结构化的计划,使用户能够引导流程并在响应过程中调整指令。系统不再仅仅立即生成文本,而是可以更仔细地思考问题,提供更准确的解决方案。
此功能显著提升了以下任务的表现:
战略分析
财务建模
技术解释
复杂研究问题
多步骤问题解决
其结果是生成更有结构、更准确、目标一致的输出,减少了后续提示的需求。
2. 超大上下文窗口 (最多100万令牌)
GPT-5.4 引入了有史以来在商业 AI 模型中部署的最大上下文窗口之一。
系统最多可以处理100万令牌的上下文,使其能够一次性分析极大量的信息。
这意味着模型现在可以处理:
整本书
大型财务报告
完整的代码库
多文档研究项目
长时间对话而不丢失上下文
与之前的版本相比,这大大提升了 AI 在复杂工作流程中维持长远记忆的能力。
3. 原生计算机操作能力
首次在 OpenAI 主要模型中,GPT-5.4 包含原生的计算机操作能力。
这意味着 AI 可以像人类用户一样与软件环境交互并执行任务,包括:
控制应用程序
浏览网站
使用键盘和鼠标命令
通过截图与图形界面交互
在衡量 AI 与计算机系统交互的基准测试中,GPT-5.4 在 OSWorld-Verified 中达到了75%的成功率,甚至在某些场景中超越了平均人类表现。
此能力对于构建自动化实际工作流程的 AI 代理尤为重要。
4. 与工作场所工具的集成
GPT-5.4 针对专业生产力进行了大量优化。
该模型现在可以更有效地与以下工具协作:
电子表格
文档
演示文稿
开发环境
企业软件
例如,系统可以生成复杂的 Excel 公式、自动化电子表格分析、撰写报告,甚至在工作流程工具中直接协助制作演示文稿。
这反映了 AI 从单纯的聊天机器人向工作场所助手转变的趋势。
5. 高级编码能力
GPT-5.4 结合了强大的编码能力和更广泛的推理能力。
开发者现在可以使用该模型:
编写和调试软件
生成大型代码库
自动化测试和调试
执行多步骤编程工作流程
在如 SWE-Bench Pro 这样的高级编码基准测试中,GPT-5.4 展示了与早期模型相比的强劲性能,同时响应速度更快。
这使其成为目前最强大的 AI 编码助手之一。
6. 复杂工作流程的工具搜索
另一项重大创新是工具搜索(Tool Search),它允许 GPT-5.4 在任务过程中动态查找和使用外部工具。
不再在请求开始时加载所有工具定义,而是根据需要搜索工具。
这种方法:
减少令牌使用
加快响应速度
提高复杂系统中的效率
对于拥有数百个工具的大型企业 AI 环境,这大大提升了性能和扩展性。
7. 改进的视觉理解
GPT-5.4 还在视觉感知和图像理解方面进行了改进。
模型现在可以处理高达 1024 万像素的高分辨率图像,显著提升以下任务的表现:
文档解析
图表分析
截图解读
用户界面交互
这些升级使 AI 系统能更有效地处理视觉数据和用户界面。
8. 主要性能提升
GPT-5.4 在多个 AI 基准测试中实现了显著提升。
主要成绩包括:
在 GDPval(衡量实际知识工作任务的基准测试)中得分 83%
在 SWE-Bench Pro 编码性能中得分 57.7%
在 BrowseComp 网络研究任务中得分 82.7%
在 OSWorld-Verified 计算机使用基准测试中成功率达 75%
这些结果显示出与早期模型相比的明显改进。
9. 更高的令牌效率和速度
GPT-5.4 另一项重大改进是令牌效率。
该模型能用明显更少的令牌解决复杂任务,从而降低:
计算成本
响应时间
基础设施负载
这使得 GPT-5.4 更加强大且高效,是企业 AI 部署的重要优势。
10. GPT-5.4 Pro 版本
OpenAI 还推出了 GPT-5.4 Pro,这是一个面向高性能计算任务的更高端版本。
该版本优化用于:
大规模自动化
企业工作负载
复杂推理
大量数据处理
Pro 版本主要面向需要最大 AI 性能的开发者和企业用户。
对 AI 未来的意义
GPT-5.4 的发布反映了 AI 行业的更广泛转变。
现代 AI 模型不再仅仅专注于对话,而是在向自主数字代理演变,能够完成跨软件系统的实际任务。
凭借计算机控制、长上下文记忆和工具集成功能,GPT-5.4 代表了向能够协助处理复杂专业工作流程和自动化的 AI 系统迈出的重要一步。
对于开发者、企业和研究人员来说,此次更新开启了在:
AI 驱动的自动化
软件开发
企业生产力
数据分析
数字研究
等方面的新可能性。
简单来说,
#OpenAIReleasesGPT-5.4
标志着2026年最重要的 AI 升级之一,将人工智能推向了更接近成为能够处理复杂实际任务的强大助手的方向。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
2人点赞了这条动态
赞赏
2
1
转发
分享
评论
0/400
评论
楚老魔
· 03-07 07:43
坚定HODL💎
回复
0
热门话题
查看更多
#
Gate2月透明度报告
6.05万 热度
#
国际油价突破100美元
15.17万 热度
#
微策略再砸12.8亿美元增持BTC
8616.24万 热度
#
哈梅内伊之子当选伊朗领袖
64.51万 热度
#
Gate蓝龙虾
3.59万 热度
热门 Gate Fun
查看更多
Gate Fun
KOL
最新发币
即将上市
成功上市
1
ido
iron dome
市值:
$0.1
持有人数:
1
0.00%
2
WKT
WKY
市值:
$0.1
持有人数:
1
0.00%
3
H
BTJ
市值:
$0.1
持有人数:
1
0.00%
4
DF
Delta Force
市值:
$2417.24
持有人数:
1
0.00%
5
YFC
YFC
市值:
$2465.41
持有人数:
2
0.23%
置顶
Gate 广场内容挖矿奖励继续升级!无论您是创作者还是用户,挖矿新人还是头部作者都能赢取好礼获得大奖。现在就进入广场探索吧!
创作者享受最高60%创作返佣
创作者奖励加码1500USDT:更多新人作者能瓜分奖池!
观众点击交易组件交易赢大礼!最高50GT等新春壕礼等你拿!
详情:https://www.gate.com/announcements/article/49802
网站地图
#OpenAIReleasesGPT-5.4 OpenAI 已正式推出 GPT-5.4,这是其前沿人工智能模型的最新演进。此次发布标志着人工智能能力的重大飞跃,特别是在专业工作、自动化、编码和大规模推理任务方面。GPT-5.4 现已在 ChatGPT、开发者 API 和 Codex 中逐步推出,将其定位为目前为企业、开发者和知识工作者提供的最先进的 AI 系统之一。
与早期主要关注对话质量的更新不同,GPT-5.4 专为在软件工具、文档、电子表格和复杂工作流程中执行实际任务而设计。该模型集成了推理、编码、计算机交互和长上下文记忆的改进,使其能够更高效、更准确地完成多步骤任务。
以下是 GPT-5.4 引入的主要功能的逐步说明。
1. GPT-5.4“思考”模式的引入
最引人注目的一项新增功能是 GPT-5.4 思考模式,这是一个以推理为重点的模型版本,旨在处理复杂的分析工作。
此模式允许 AI 在生成最终答案之前制定结构化的计划,使用户能够引导流程并在响应过程中调整指令。系统不再仅仅立即生成文本,而是可以更仔细地思考问题,提供更准确的解决方案。
此功能显著提升了以下任务的表现:
战略分析
财务建模
技术解释
复杂研究问题
多步骤问题解决
其结果是生成更有结构、更准确、目标一致的输出,减少了后续提示的需求。
2. 超大上下文窗口 (最多100万令牌)
GPT-5.4 引入了有史以来在商业 AI 模型中部署的最大上下文窗口之一。
系统最多可以处理100万令牌的上下文,使其能够一次性分析极大量的信息。
这意味着模型现在可以处理:
整本书
大型财务报告
完整的代码库
多文档研究项目
长时间对话而不丢失上下文
与之前的版本相比,这大大提升了 AI 在复杂工作流程中维持长远记忆的能力。
3. 原生计算机操作能力
首次在 OpenAI 主要模型中,GPT-5.4 包含原生的计算机操作能力。
这意味着 AI 可以像人类用户一样与软件环境交互并执行任务,包括:
控制应用程序
浏览网站
使用键盘和鼠标命令
通过截图与图形界面交互
在衡量 AI 与计算机系统交互的基准测试中,GPT-5.4 在 OSWorld-Verified 中达到了75%的成功率,甚至在某些场景中超越了平均人类表现。
此能力对于构建自动化实际工作流程的 AI 代理尤为重要。
4. 与工作场所工具的集成
GPT-5.4 针对专业生产力进行了大量优化。
该模型现在可以更有效地与以下工具协作:
电子表格
文档
演示文稿
开发环境
企业软件
例如,系统可以生成复杂的 Excel 公式、自动化电子表格分析、撰写报告,甚至在工作流程工具中直接协助制作演示文稿。
这反映了 AI 从单纯的聊天机器人向工作场所助手转变的趋势。
5. 高级编码能力
GPT-5.4 结合了强大的编码能力和更广泛的推理能力。
开发者现在可以使用该模型:
编写和调试软件
生成大型代码库
自动化测试和调试
执行多步骤编程工作流程
在如 SWE-Bench Pro 这样的高级编码基准测试中,GPT-5.4 展示了与早期模型相比的强劲性能,同时响应速度更快。
这使其成为目前最强大的 AI 编码助手之一。
6. 复杂工作流程的工具搜索
另一项重大创新是工具搜索(Tool Search),它允许 GPT-5.4 在任务过程中动态查找和使用外部工具。
不再在请求开始时加载所有工具定义,而是根据需要搜索工具。
这种方法:
减少令牌使用
加快响应速度
提高复杂系统中的效率
对于拥有数百个工具的大型企业 AI 环境,这大大提升了性能和扩展性。
7. 改进的视觉理解
GPT-5.4 还在视觉感知和图像理解方面进行了改进。
模型现在可以处理高达 1024 万像素的高分辨率图像,显著提升以下任务的表现:
文档解析
图表分析
截图解读
用户界面交互
这些升级使 AI 系统能更有效地处理视觉数据和用户界面。
8. 主要性能提升
GPT-5.4 在多个 AI 基准测试中实现了显著提升。
主要成绩包括:
在 GDPval(衡量实际知识工作任务的基准测试)中得分 83%
在 SWE-Bench Pro 编码性能中得分 57.7%
在 BrowseComp 网络研究任务中得分 82.7%
在 OSWorld-Verified 计算机使用基准测试中成功率达 75%
这些结果显示出与早期模型相比的明显改进。
9. 更高的令牌效率和速度
GPT-5.4 另一项重大改进是令牌效率。
该模型能用明显更少的令牌解决复杂任务,从而降低:
计算成本
响应时间
基础设施负载
这使得 GPT-5.4 更加强大且高效,是企业 AI 部署的重要优势。
10. GPT-5.4 Pro 版本
OpenAI 还推出了 GPT-5.4 Pro,这是一个面向高性能计算任务的更高端版本。
该版本优化用于:
大规模自动化
企业工作负载
复杂推理
大量数据处理
Pro 版本主要面向需要最大 AI 性能的开发者和企业用户。
对 AI 未来的意义
GPT-5.4 的发布反映了 AI 行业的更广泛转变。
现代 AI 模型不再仅仅专注于对话,而是在向自主数字代理演变,能够完成跨软件系统的实际任务。
凭借计算机控制、长上下文记忆和工具集成功能,GPT-5.4 代表了向能够协助处理复杂专业工作流程和自动化的 AI 系统迈出的重要一步。
对于开发者、企业和研究人员来说,此次更新开启了在:
AI 驱动的自动化
软件开发
企业生产力
数据分析
数字研究
等方面的新可能性。
简单来说,#OpenAIReleasesGPT-5.4 标志着2026年最重要的 AI 升级之一,将人工智能推向了更接近成为能够处理复杂实际任务的强大助手的方向。