✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
ChatGPT 图像 2.0 登场!号称会思考、文字渲染进化,实测牛肉面菜单效果
OpenAI推出ChatGPT Images 2.0生图工具,主打强大的复杂排版与多语系文字(包含中文)处理能力。本文将全面介绍Images 2.0功能、特色、免费与付费方案功能,以及实测生成结果。
ChatGPT Images 2.0 是什么?主要功能、特色告诉你!
能与 Gemini Nano Banana 2 较量的 AI 生图工具来了?OpenAI 宣布推出 ChatGPT Images 2.0,由全新的 GPT Image 2 模型驱动,主打优秀的图像应该具备选择、排列与揭示信息的能力。以下是 ChatGPT Images 2.0 的 3 大特色:
强大的排版与多语系文字处理
首先一个比较明显的特色是,ChatGPT Images 2.0 大幅提升的排版与多语系文字处理能力。
外媒《Techcrunch》指出,以前的 AI 图像生成工具多半采用扩散模型,在拼写文字方面经常遇到困难。ChatGPT Images 2.0 能精确呈现微小文字、图示与使用者界面等细节。
OpenAI 表示,Images 2.0 在处理非拉丁字母的语言上有显著的进步,包含中文、日文、韩文、印地文与孟加拉文等,都能以极高的清晰度生成在图像中。
图源:OpenAI ChatGPT Images 2.0官方生成示例
全新的思考能力与联网搜索
除了排版与多语系文字处理能力外,ChatGPT Images 2.0 还提供全新的思考能力,可以通过即时搜索网络资讯来协助生成图像。该模型的知识库更新至 2025 年 12 月,有助于生成涉及近期事件的内容。
图源:OpenAI ChatGPT Images 2.0官方生成示例
支持 2K 解析度与多样化长宽比
ChatGPT Images 2.0 支持高达 2K 解析度的图像生成,并提供更广泛的长宽比选择,从宽幅的 3:1 到长幅的 1:3 皆涵盖在内。
OpenAI 研究负责人陈博远(Boyuan Chen)表示,Images 2.0 架构已经过全面改版,属于一种通用模型,只需通过简单的文字提示,就能处理 3D 风格的视角转换与复杂的空间推理。
ChatGPT Images 2.0 免费、付费方案用户功能
一分钱一分货?ChatGPT Images 2.0 不同层级的付费用户,能解锁的功能也不同,整理如下:
ChatGPT Images 2.0 实测:菜单、杂志、解释图表等
ChatGPT Images 2.0 的实际表现,是否符合 OpenAI 的宣传呢?我们来实测一下。
实测牛肉面店菜单
《加密城市》编辑使用 ChatGPT 免费方案实测,制作一份台湾牛肉面料理菜单,提示词只简单说明:“帮我生成一张主打台湾牛肉面料理的菜单,菜单上面要使用繁体中文,呈现出每道菜的名称、价格、图像资讯。”
以下是生成结果:
图源:ChatGPT Images 2.0生成
以免费方案能生成出来的内容来说,乍看起来还算不错,只不过细看仍会发现 Images 2.0 在处理笔画比较复杂的繁体中文字时,仍会出现书写错误的问题,也许付费方案生成结果会更好。
另外生成结果算是有接近于台北牛肉面价格,而且还可以内用免费加面一次。
不过如果你的菜单要印出来,在印刷实务上,将 ChatGPT Images 2.0 提供的图档,转化成向量档(如 EPS、Adobe illustrator 的 .ai 档、PDF),并使用 CMYK 色调,是最适合印刷的。印刷厂虽也可能接受 JPG 与 PNG 档案,但若你对印刷成果有很大的要求,会较难调整成你要的样子。
实测科技杂志封面
接下来实测科幻杂志封面,这次《加密城市》测试处理复杂排版的效果,提示词为:“帮我生成一张以繁体中文制作的科技杂志封面,杂志名称是「加密城市」,主题为「区块链与 AI 的交汇」,这个封面要有标题、卷号、条码上方的显示期限日期,所有文字都要呈现出清晰且专业的对齐效果。”
以下是生成结果:
图源:ChatGPT Images 2.0生成
这个测试结果跟上面的类似,都是乍看不错但细看在处理复杂笔画的中文时仍有缺失,另外封面字体与台湾字体商 Justfont 的「金萱体」非常像,不知道是否有取得授权。
这样的疑惑,《加密城市》也曾在 Nano Banana Pro 推出时提出过。
实测多国语言解释性图表
《加密城市》测试了一张地震发生原因的繁体中文、日文、韩文图表,复杂多国语言文字有大致渲染成功。在排版方面有根据语言不同,使用不同的颜色区分。虽然细看一样有部分复杂笔画的中文、汉字或韩文有模糊的问题。
以下是生成结果:
图源:ChatGPT Images 2.0生成
Images 2.0 可保持角色物件一致性,解决繁琐流程
另外,Images 2.0 也像 Nano Banana 2 一样拥有可编辑性,只要点击生成图像左下方的「编辑」就可开始操作,可保持角色与物件一致性,让生成漫画页面、社群媒体图文系列或房屋各房间的设计平面图变得更加容易。
ChatGPT Images 产品负责人 Adele Li 表示,这项功能解决了以往用户必须逐一生成单张图片并手动拼接的繁琐流程,让创作者可以轻松打造具备相同视觉基因的儿童绘本或品牌行销活动素材。