ChatGPT 图像 2.0 怎么用?实测牛肉面菜单、杂志封面、多国语言科普效果

robot
摘要生成中

OpenAI推出ChatGPT Images 2.0生图工具,主打强大的复杂排版与多语系文字(包含中文)处理能力。本文将全面介绍Images 2.0功能、特色、免费与付费方案功能,以及实测生成结果。

ChatGPT Images 2.0是什么?主要功能、特色告诉你!

能与 Gemini Nano Banana 2 较量的 AI 生图工具来了?OpenAI 宣布推出 ChatGPT Images 2.0,由全新的 GPT Image 2 模型驱动,主打优秀的图像应该具备选择、排列与揭示信息的能力。以下是 ChatGPT Images 2.0 的 3 大特色:

强大的排版与多语系文字处理

首先一个比较明显的特色是,ChatGPT Images 2.0 大幅提升的排版与多语系文字处理能力。

外媒《Techcrunch》指出,以前的 AI 图像生成工具多半采用扩散模型,在拼写文字方面经常遇到困难。ChatGPT Images 2.0 能精准呈现微小文字、图示与用户界面等细节。

OpenAI 表示,Images 2.0 在处理非拉丁字母语言方面有显著的进步,包括中文、日文、韩文、印地文与孟加拉文等,都能以极高的清晰度生成到图像中。

图源:OpenAI ChatGPT Images 2.0 官方生成范例

全新思考能力与联网搜索

除了排版与多语系文字处理能力外,ChatGPT Images 2.0 还提供全新的思考能力,可以通过即时搜索网络资讯来协助生成图像。该模型的知识库更新至 2025 年 12 月,有助于生成涉及近期事件的内容。

图源:OpenAI ChatGPT Images 2.0 官方生成范例

支持 2K 解析度与多样化长宽比

ChatGPT Images 2.0 支持高达 2K 解析度的图像生成,并提供更广泛的长宽比选择,从宽幅的 3:1 到长幅的 1:3 皆涵盖在内。

OpenAI 研究负责人陈博远(Boyuan Chen)表示,Images 2.0 架构已经经过全面改版,属于一种通用模型。只需通过简单的文字提示,就能处理 3D 风格的视角转换与复杂的空间推理。

ChatGPT Images 2.0 免费、付费方案用户功能

一分钱一分货?ChatGPT Images 2.0 不同层级的付费用户,能解锁的功能也不同,整理如下:

  • 免费用户: 目前可以使用基础的 ImageGen 2.0 模型来执行标准的图像生成任务。基础版本已经包含许多核心升级,例如更好的指令遵循能力、更强大的文字渲染效果、多语系支持以及更多元的长宽比选项。
  • ChatGPT Plus、Business 与 Enterprise 用户: 这些付费用户可以启用全新的思考模型。在该模式下,聊天机器人的图像生成器会运用网络搜索资讯,根据用户上传的档案建立视觉解说图,并在实际生成图像前预先进行结构推理。单次最多可同时生成 8 张图像,且能确保每个场景中的角色、物件与风格保持一致。
  • Pro 用户: 这些用户将获得更进阶的 ImageGen Pro 模型访问权限。虽然 OpenAI 尚未提供 Pro 与思考功能之间精确的差异细节,但企业用户可将思考功能视为实质的功能升级,适用于需要事实依据、将内部文件转换为解说图,或是需要在多项资产中保持视觉一致性的任务。
  • API 开发人员: 现在能整合 gpt-image-2 模型,并支持高解析度与灵活的长宽比设定。

ChatGPT Images 2.0 实测:菜单、杂志、解释性图表等

ChatGPT Images 2.0 的实际表现,是否符合 OpenAI 的宣传呢?我们来实测一下。

实测牛肉面店菜单

《加密城市》编辑使用 ChatGPT 免费方案实测,制作一份台湾牛肉面料理菜单。提示词只简单说明:“帮我生成一张主打台湾牛肉面料理的菜单,菜单上面要使用繁体中文,呈现出每道菜的名称、价格、图像信息。”

以下是生成结果:

图源:ChatGPT Images 2.0 生成

就免费方案能生成出来的内容而言,乍看起来还算不错;只不过细看仍会发现 Images 2.0 在处理笔画比较复杂的繁体中文字时,仍会出现书写错误的问题。也许付费方案的生成结果会更好。

另外,生成结果也算是有贴近台北牛肉面价格,而且还可以内用免费加面一次。

不过,如果你的菜单要印出来,在印刷实务上,将 ChatGPT Images 2.0 提供的图档转化成向量档(如 EPS、Adobe illustrator 的 .ai 档、PDF),并使用 CMYK 色调,是最适合印刷的。印刷厂虽也可能接受 JPG 与 PNG 档案,但如果你对印刷成果有很大的要求,会较难调整成你要的样子。

实测科技杂志封面

接下来实测科幻杂志封面,这次《加密城市》测试处理复杂排版的效果。提示词为:“帮我生成一张以繁体中文制作的科技杂志封面,杂志名称是「加密城市」,主题为「区块链与 AI 的交汇」,这个封面要有标题、卷号、条码上方的显示期限日期,所有文字都要呈现出清晰且专业的对齐效果。”

以下是生成结果:

图源:ChatGPT Images 2.0 生成

这个测试结果跟上面的类似,都是乍看不错,但细看在处理复杂笔画的中文时仍有缺失。另外,封面字体与台湾字体商 Justfont 的「金萱体」蛮像的,不知道是否有取得授权。

这样的疑惑,《加密城市》也曾在 Nano Banana Pro 推出时提出过。

  • 相关报道: Nano Banana Pro 实测:中文字有进步!但动画、字体侵权疑虑也浮现

实测多国语言解释性图表

《加密城市》测试了一张地震发生原因的繁体中文、日文、韩文图表,复杂多国语言文字有大致渲染成功。在排版方面有根据语言不同使用不同的颜色区分,虽然细看一样有部分复杂笔画的中文、汉字或韩文存在模糊问题。

以下是生成结果:

图源:ChatGPT Images 2.0 生成

Images 2.0 可保持角色物件一致性,解决繁琐流程

另外,Images 2.0 也像 Nano Banana 2 一样拥有可编辑性。只要点击生成图像左下方的「编辑」就可开始操作,可保持角色与物件一致性,让生成漫画页面、社群媒体图文系列或房屋各房间的设计平面图变得更加容易。

ChatGPT Images 产品负责人 Adele Li 表示,这项功能解决了以往用户必须逐一生成单张图片并手动拼接的繁琐流程,让创作者可以轻松打造具备相同视觉基因的儿童绘本或品牌行销活动素材。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论