ChatGPT 图像 2.0 登场!号称会思考、文字渲染进化,实测牛肉面菜单效果

robot
摘要生成中

OpenAI推出ChatGPT Images 2.0生图工具,主打强大的复杂排版与多语系文字(包含中文)处理能力。本文将全面介绍Images 2.0功能、特色、免费与付费方案功能,以及实测生成结果。

ChatGPT Images 2.0 是什么?主要功能、特色告诉你!

能与 Gemini Nano Banana 2 较量的 AI 生图工具来了?OpenAI 宣布推出 ChatGPT Images 2.0,由全新的 GPT Image 2 模型驱动,主打优秀的图像应该具备选择、排列与揭示信息的能力。以下是 ChatGPT Images 2.0 的 3 大特色:

强大的排版与多语系文字处理

首先一个比较明显的特色是,ChatGPT Images 2.0 大幅提升的排版与多语系文字处理能力。

外媒《Techcrunch》指出,以前的 AI 图像生成工具多半采用扩散模型,在拼写文字方面经常遇到困难。ChatGPT Images 2.0 能精确呈现微小文字、图示与使用者界面等细节。

OpenAI 表示,Images 2.0 在处理非拉丁字母的语言上有显著的进步,包含中文、日文、韩文、印地文与孟加拉文等,都能以极高的清晰度生成在图像中。

图源:OpenAI ChatGPT Images 2.0官方生成示例

全新的思考能力与联网搜索

除了排版与多语系文字处理能力外,ChatGPT Images 2.0 还提供全新的思考能力,可以通过即时搜索网络资讯来协助生成图像。该模型的知识库更新至 2025 年 12 月,有助于生成涉及近期事件的内容。

图源:OpenAI ChatGPT Images 2.0官方生成示例

支持 2K 解析度与多样化长宽比

ChatGPT Images 2.0 支持高达 2K 解析度的图像生成,并提供更广泛的长宽比选择,从宽幅的 3:1 到长幅的 1:3 皆涵盖在内。

OpenAI 研究负责人陈博远(Boyuan Chen)表示,Images 2.0 架构已经过全面改版,属于一种通用模型,只需通过简单的文字提示,就能处理 3D 风格的视角转换与复杂的空间推理。

ChatGPT Images 2.0 免费、付费方案用户功能

一分钱一分货?ChatGPT Images 2.0 不同层级的付费用户,能解锁的功能也不同,整理如下:

  • 免费用户: 目前可以使用基础的 ImageGen 2.0 模型来执行标准的图像生成任务。基础版本已经包含许多核心升级,例如更好的指令遵循能力、更强大的文字渲染效果、多语系支持以及更多元的长宽比选项。
  • ChatGPT Plus、Business 与 Enterprise 用户: 这些付费用户可以启用全新的思考模型。在该模式下,聊天机器人的图像生成器会运用网络搜索资讯,根据用户上传的档案建立视觉解说图,并在实际生成图像前预先进行结构推理。单次最多可同时生成 8 张图像,且能确保每个场景中的角色、物件与风格保持一致。
  • Pro 用户: 这些用户将获得更进阶的 ImageGen Pro 模型存取权限。虽然 OpenAI 尚未提供 Pro 与思考功能之间精确的差异细节,但企业用户可将思考功能视为实质的功能升级,适用于需要事实依据、转换内部文件为解说图,或是需要在多项资产中保持视觉一致性的任务。
  • API 开发人员: 现在能整合 gpt-image-2 模型,并支持高解析度与灵活的长宽比设定。

ChatGPT Images 2.0 实测:菜单、杂志、解释图表等

ChatGPT Images 2.0 的实际表现,是否符合 OpenAI 的宣传呢?我们来实测一下。

实测牛肉面店菜单

《加密城市》编辑使用 ChatGPT 免费方案实测,制作一份台湾牛肉面料理菜单,提示词只简单说明:“帮我生成一张主打台湾牛肉面料理的菜单,菜单上面要使用繁体中文,呈现出每道菜的名称、价格、图像资讯。”

以下是生成结果:

图源:ChatGPT Images 2.0生成

以免费方案能生成出来的内容来说,乍看起来还算不错,只不过细看仍会发现 Images 2.0 在处理笔画比较复杂的繁体中文字时,仍会出现书写错误的问题,也许付费方案生成结果会更好。

另外生成结果算是有接近于台北牛肉面价格,而且还可以内用免费加面一次。

不过如果你的菜单要印出来,在印刷实务上,将 ChatGPT Images 2.0 提供的图档,转化成向量档(如 EPS、Adobe illustrator 的 .ai 档、PDF),并使用 CMYK 色调,是最适合印刷的。印刷厂虽也可能接受 JPG 与 PNG 档案,但若你对印刷成果有很大的要求,会较难调整成你要的样子。

实测科技杂志封面

接下来实测科幻杂志封面,这次《加密城市》测试处理复杂排版的效果,提示词为:“帮我生成一张以繁体中文制作的科技杂志封面,杂志名称是「加密城市」,主题为「区块链与 AI 的交汇」,这个封面要有标题、卷号、条码上方的显示期限日期,所有文字都要呈现出清晰且专业的对齐效果。”

以下是生成结果:

图源:ChatGPT Images 2.0生成

这个测试结果跟上面的类似,都是乍看不错但细看在处理复杂笔画的中文时仍有缺失,另外封面字体与台湾字体商 Justfont 的「金萱体」非常像,不知道是否有取得授权。

这样的疑惑,《加密城市》也曾在 Nano Banana Pro 推出时提出过。

  • **相关报道:**Nano Banana Pro 实测:中文字有进步!但动画、字体侵权疑虑也浮现

实测多国语言解释性图表

《加密城市》测试了一张地震发生原因的繁体中文、日文、韩文图表,复杂多国语言文字有大致渲染成功。在排版方面有根据语言不同,使用不同的颜色区分。虽然细看一样有部分复杂笔画的中文、汉字或韩文有模糊的问题。

以下是生成结果:

图源:ChatGPT Images 2.0生成

Images 2.0 可保持角色物件一致性,解决繁琐流程

另外,Images 2.0 也像 Nano Banana 2 一样拥有可编辑性,只要点击生成图像左下方的「编辑」就可开始操作,可保持角色与物件一致性,让生成漫画页面、社群媒体图文系列或房屋各房间的设计平面图变得更加容易。

ChatGPT Images 产品负责人 Adele Li 表示,这项功能解决了以往用户必须逐一生成单张图片并手动拼接的繁琐流程,让创作者可以轻松打造具备相同视觉基因的儿童绘本或品牌行销活动素材。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论