Como usar o ChatGPT Imagens 2.0? Teste prático de menu de carne bovina, capa de revista, efeito de divulgação em vários idiomas

robot
Geração do resumo em andamento

OpenAI lança o ferramenta de imagens do ChatGPT 2.0, com foco em capacidades poderosas de layout complexo e processamento de textos multilíngues (incluindo chinês), este artigo apresentará uma introdução completa às funcionalidades do Images 2.0, suas características, planos gratuitos e pagos, além de resultados de testes reais de geração de imagens.

O que é o ChatGPT Images 2.0? Conheça suas principais funções e características!

Uma ferramenta de geração de imagens AI capaz de competir com o Gemini Nano Banana 2 chegou? OpenAI anunciou o lançamento do ChatGPT Images 2.0, alimentado pelo novo modelo GPT Image 2, que destaca a habilidade de selecionar, organizar e revelar informações em imagens. A seguir, as 3 principais características do ChatGPT Images 2.0:

Processamento avançado de layout e textos multilíngues

Primeiramente, uma característica bastante evidente é a significativa melhoria na capacidade de layout e processamento de textos multilíngues do ChatGPT Images 2.0.

Segundo a mídia especializada Techcrunch, as ferramentas de geração de imagens AI anteriores geralmente utilizavam modelos de difusão, que frequentemente enfrentavam dificuldades na escrita de textos. O ChatGPT Images 2.0 consegue apresentar detalhes como textos pequenos, ícones e interfaces de usuário com alta precisão.

OpenAI afirma que o Images 2.0 apresenta avanços notáveis no processamento de idiomas que usam alfabetos não latinos, incluindo chinês, japonês, coreano, hindi e bengali, podendo gerar esses textos com altíssima clareza nas imagens.

Fonte: Exemplos oficiais gerados pelo ChatGPT Images 2.0 da OpenAI

Capacidade de raciocínio e busca na internet renovadas

Além do processamento de layout e textos multilíngues, o ChatGPT Images 2.0 oferece uma nova capacidade de raciocínio, podendo buscar informações na internet em tempo real para ajudar na geração de imagens. O banco de dados do modelo é atualizado até dezembro de 2025, auxiliando na criação de conteúdos relacionados a eventos recentes.

Fonte: Exemplos oficiais gerados pelo ChatGPT Images 2.0 da OpenAI

Suporte a resolução 2K e proporções variadas

O ChatGPT Images 2.0 suporta geração de imagens com resolução de até 2K e oferece uma gama mais ampla de proporções, desde 3:1 para imagens panorâmicas até 1:3 para imagens verticais.

O responsável pela pesquisa da OpenAI, Boyuan Chen, afirmou que a arquitetura do Images 2.0 foi completamente reformulada, sendo um modelo universal que, com comandos de texto simples, consegue lidar com conversões de perspectiva em estilo 3D e raciocínio espacial complexo.

Funcionalidades dos planos gratuitos e pagos do ChatGPT Images 2.0

Dinheiro fala? Usuários de diferentes níveis de assinatura do ChatGPT Images 2.0 têm acesso a funcionalidades distintas, listadas a seguir:

  • Usuários gratuitos: Atualmente, podem usar o modelo básico ImageGen 2.0 para tarefas padrão de geração de imagens. A versão básica já inclui várias melhorias essenciais, como melhor conformidade com comandos, renderização de textos mais robusta, suporte multilíngue e maior variedade de proporções.
  • Usuários do ChatGPT Plus, Business e Enterprise: Esses assinantes podem ativar o novo modo de raciocínio. Nesse modo, o gerador de imagens do chatbot utiliza buscas na internet, cria diagramas visuais a partir de arquivos enviados pelo usuário e realiza raciocínio estrutural antes de gerar as imagens. É possível gerar até 8 imagens simultaneamente, garantindo consistência nos personagens, objetos e estilos de cada cena.
  • Usuários Pro: Têm acesso ao modelo ImageGen Pro mais avançado. Embora a OpenAI ainda não tenha detalhado exatamente as diferenças entre Pro e o modo de raciocínio, empresas podem considerar o raciocínio como uma atualização funcional, útil para tarefas que exigem fatos, conversão de documentos internos em diagramas explicativos ou manutenção de consistência visual em múltiplos ativos.
  • Desenvolvedores de API: Agora podem integrar o modelo gpt-image-2, suportando alta resolução e configurações flexíveis de proporções.

Testes do ChatGPT Images 2.0: menus, revistas, gráficos explicativos

Como o desempenho real do ChatGPT Images 2.0 corresponde às promessas da OpenAI? Vamos testar.

Teste de menu de restaurante de carne bovina

Um editor do “Crypto City” testou a versão gratuita do ChatGPT, criando um menu de carne bovina taiwanês com uma solicitação simples: “Por favor, gere um menu focado em pratos de carne bovina taiwanesa, usando chinês tradicional, mostrando nomes, preços e informações visuais de cada prato.”

A seguir, o resultado gerado:

Fonte: Imagem gerada pelo ChatGPT Images 2.0

Para o conteúdo gerado na versão gratuita, o resultado parece razoável à primeira vista, mas ao observar com mais atenção, ainda há problemas na escrita de caracteres tradicionais chineses com traços mais complexos, apresentando erros de caligrafia. Talvez a versão paga produza resultados melhores.

Além disso, o preço gerado aproxima-se do valor de um prato de carne bovina em Taipei, e há a possibilidade de incluir uma porção extra gratuitamente para consumo no local.

Porém, se o menu for para impressão, o ideal é converter as imagens geradas pelo ChatGPT Images 2.0 em arquivos vetoriais (como EPS, .ai do Adobe Illustrator ou PDF) usando o modo CMYK, para garantir a melhor qualidade de impressão. Embora as gráficas possam aceitar JPG ou PNG, para resultados profissionais, ajustes adicionais podem ser necessários.

Teste de capa de revista de tecnologia

Em seguida, testamos uma capa de revista de ficção científica, usando a frase: “Por favor, gere uma capa de revista de tecnologia em chinês tradicional, com o título ‘Crypto City’, tema ‘Encontro entre Blockchain e IA’. A capa deve incluir título, número da edição, código de barras e a data de validade acima do código, com todos os textos bem alinhados e profissionais.”

A seguir, o resultado:

Fonte: Imagem gerada pelo ChatGPT Images 2.0

Este resultado é semelhante ao anterior, aparentando estar bom à primeira vista, mas ao analisar detalhes, ainda há falhas na escrita de caracteres chineses complexos. Além disso, a fonte da capa lembra bastante a “Jin Xuan” da Justfont, uma fonte comercial de Taiwan, levantando dúvidas sobre a licença de uso.

Dúvidas semelhantes já foram levantadas quando o “Crypto City” lançou o Nano Banana Pro.

  • Reportagem relacionada: Teste do Nano Banana Pro: avanços nos caracteres chineses! Mas surgem dúvidas sobre direitos de animação e fontes

Teste de gráficos explicativos multilíngues

O “Crypto City” testou um gráfico de causa de terremoto em chinês tradicional, japonês e coreano, com textos multilíngues complexos, que tiveram renderização geral bem-sucedida. Na disposição, diferentes cores foram usadas para distinguir os idiomas, embora, ao observar de perto, alguns caracteres chineses, kanji ou coreanos com traços complexos ainda apresentem problemas de borrão.

A seguir, o resultado:

Fonte: Imagem gerada pelo ChatGPT Images 2.0

Imagens 2.0 mantêm consistência de personagens e objetos, resolvendo processos complicados

Além disso, o Images 2.0, assim como o Nano Banana 2, possui capacidade de edição. Basta clicar em “Editar” no canto inferior esquerdo da imagem gerada para começar a modificar, mantendo a consistência de personagens e objetos. Isso facilita a criação de páginas de quadrinhos, séries de posts para redes sociais ou plantas de design de diferentes cômodos de uma casa.

A responsável pelo produto ChatGPT Images, Adele Li, afirmou que essa funcionalidade resolve o problema de processos trabalhosos anteriores, onde os usuários precisavam gerar uma imagem de cada vez e montar manualmente. Agora, criadores podem facilmente produzir livros infantis com uma identidade visual uniforme ou materiais de marketing de marca.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar