Como usar o ChatGPT Imagens 2.0? Teste de menu de macarrão com carne, capa de revista, efeito de divulgação científica em vários idiomas

robot
Geração do resumo em andamento

OpenAI lança a ferramenta de imagens ChatGPT 2.0, com foco em capacidades poderosas de layout complexo e processamento de textos multilíngues (incluindo chinês), este artigo apresentará uma introdução completa às funcionalidades do Images 2.0, suas características, planos gratuitos e pagos, além de resultados de geração prática.

O que é o ChatGPT Images 2.0? Conheça suas principais funções e características!

Uma ferramenta de geração de imagens AI capaz de competir com o Gemini Nano Banana 2 chegou? OpenAI anunciou o lançamento do ChatGPT Images 2.0, alimentado pelo novo modelo GPT Image 2, que destaca-se por sua excelente capacidade de selecionar, organizar e revelar informações em imagens. A seguir, as três principais características do ChatGPT Images 2.0:

Processamento avançado de layout e textos multilíngues

Primeiramente, uma característica bastante evidente é a significativa melhoria na capacidade de layout e processamento de textos multilíngues do ChatGPT Images 2.0.

A mídia estrangeira Techcrunch apontou que, anteriormente, muitas ferramentas de geração de imagens AI utilizavam modelos de difusão, frequentemente enfrentando dificuldades na escrita de textos. O ChatGPT Images 2.0 consegue apresentar detalhes pequenos, ícones e interfaces de usuário com alta precisão.

OpenAI afirma que o Images 2.0 apresenta avanços notáveis no processamento de idiomas que usam alfabetos não latinos, incluindo chinês, japonês, coreano, hindi e bengali, podendo gerar esses textos com altíssima clareza nas imagens.

Fonte: Exemplos oficiais gerados pelo OpenAI ChatGPT Images 2.0

Nova capacidade de raciocínio e busca na internet

Além do processamento de layout e textos multilíngues, o ChatGPT Images 2.0 oferece uma nova capacidade de raciocínio, podendo buscar informações na internet em tempo real para ajudar na geração de imagens. O banco de dados do modelo é atualizado até dezembro de 2025, auxiliando na criação de conteúdos relacionados a eventos recentes.

Fonte: Exemplos oficiais gerados pelo OpenAI ChatGPT Images 2.0

Suporte a resolução 2K e proporções variadas

O ChatGPT Images 2.0 suporta geração de imagens com resolução de até 2K e oferece uma gama mais ampla de proporções, desde 3:1 para imagens panorâmicas até 1:3 para imagens verticais.

Boyuan Chen, responsável pela pesquisa da OpenAI, afirmou que a arquitetura do Images 2.0 foi completamente reformulada, sendo um modelo universal que, com comandos de texto simples, consegue realizar transformações de perspectiva em 3D e raciocínio espacial complexo.

Funcionalidades dos planos gratuito e pago do ChatGPT Images 2.0

Dinheiro vale? Usuários de diferentes níveis de assinatura do ChatGPT Images 2.0 têm acesso a funcionalidades distintas, listadas a seguir:

  • Usuários gratuitos: Atualmente, podem usar o modelo básico ImageGen 2.0 para tarefas padrão de geração de imagens. A versão básica já inclui várias melhorias essenciais, como melhor conformidade com comandos, efeitos de renderização de texto mais robustos, suporte multilíngue e maior variedade de proporções.
  • Usuários do ChatGPT Plus, Business e Enterprise: Esses assinantes podem ativar o novo modo de raciocínio. Nesse modo, o gerador de imagens do chatbot usa buscas na internet, cria diagramas visuais a partir de arquivos enviados pelo usuário e realiza raciocínio estrutural antes de gerar as imagens. É possível gerar até 8 imagens simultaneamente, garantindo consistência nos personagens, objetos e estilos de cada cena.
  • Usuários Pro: Têm acesso ao modelo ImageGen Pro mais avançado. Embora a OpenAI ainda não tenha detalhado exatamente as diferenças entre Pro e o modo de raciocínio, empresas podem considerar o raciocínio como uma atualização funcional, útil para tarefas que exigem fatos, conversão de documentos internos em diagramas explicativos ou manutenção de consistência visual em múltiplos ativos.
  • Desenvolvedores de API: Agora podem integrar o modelo gpt-image-2, suportando alta resolução e configurações flexíveis de proporção.

Testes do ChatGPT Images 2.0: menus, revistas, gráficos explicativos, etc.

Como o desempenho real do ChatGPT Images 2.0 corresponde às promessas da OpenAI? Vamos testar.

Teste de menu de restaurante de carne bovina

A equipe do Crypto City usou a versão gratuita do ChatGPT para criar um menu de carne bovina taiwanesa, com a seguinte instrução simples: “Por favor, gere uma imagem de um menu focado em pratos de carne bovina taiwanesa, usando chinês tradicional, mostrando nomes, preços e informações visuais de cada prato.”

A seguir, o resultado gerado:

Fonte: Gerado pelo ChatGPT Images 2.0

Para o conteúdo gerado na versão gratuita, parece razoável à primeira vista, mas ao observar com mais atenção, ainda há problemas na escrita de caracteres tradicionais chineses com traços mais complexos, podendo ocorrer erros de caligrafia. Talvez a versão paga produza resultados melhores.

Além disso, o resultado aproxima-se dos preços de carne bovina em Taipei, e ainda permite uma porção extra gratuita para consumo no local.

Porém, se o menu for para impressão, o ideal é converter as imagens geradas pelo ChatGPT Images 2.0 em arquivos vetoriais (como EPS, .ai do Adobe Illustrator ou PDF) e usar o modo CMYK, o que é mais adequado para impressão. Embora as gráficas possam aceitar JPG ou PNG, se você tiver requisitos elevados de qualidade, será mais difícil ajustar o resultado final.

Teste de capa de revista de tecnologia

Em seguida, testamos uma capa de revista de ficção científica, usando a mesma revista Crypto City para verificar o processamento de layout complexo. A instrução foi: “Por favor, gere uma capa de revista de tecnologia em chinês tradicional, com o nome ‘Crypto City’, tema ‘Interseção de Blockchain e IA’, incluindo título, número da edição, código de barras e data de validade na parte superior, com todos os textos claros e alinhados de forma profissional.”

A seguir, o resultado:

Fonte: Gerado pelo ChatGPT Images 2.0

Este resultado é semelhante ao anterior, aparentando estar bom à primeira vista, mas ao analisar detalhes, ainda há falhas na escrita de caracteres chineses com traços complexos. Além disso, a fonte da capa lembra bastante a fonte “Jin Xuan” da Justfont, uma fonte taiwanesa, levantando dúvidas sobre possível licença.

Dúvidas como essas já foram levantadas pela Crypto City na época do lançamento do Nano Banana Pro.

  • Reportagem relacionada: Teste do Nano Banana Pro: avanços nos caracteres chineses! Mas surgem dúvidas sobre direitos de animação e fontes.

Teste de gráficos explicativos multilíngues

A Crypto City testou um gráfico de causa de terremoto em chinês tradicional, japonês e coreano, com textos multilíngues complexos, que tiveram uma renderização geral bem-sucedida. Na disposição, diferentes cores foram usadas para distinguir os idiomas, embora, ao observar de perto, alguns caracteres chineses, kanji ou coreanos com traços complexos ainda apresentem problemas de borrão.

A seguir, o resultado:

Fonte: Gerado pelo ChatGPT Images 2.0

Images 2.0 mantém a consistência de personagens e objetos, resolvendo processos complicados

Além disso, o Images 2.0 também possui editabilidade, assim como o Nano Banana 2. Basta clicar em “Editar” no canto inferior esquerdo da imagem gerada para começar a editar, mantendo a consistência de personagens e objetos. Isso facilita a criação de páginas de quadrinhos, séries de posts para redes sociais ou plantas de design de diferentes cômodos de uma casa.

A responsável pelo produto ChatGPT Images, Adele Li, afirmou que essa funcionalidade resolve o antigo problema de usuários que precisavam gerar uma imagem de cada vez e montar manualmente, permitindo que criadores desenvolvam facilmente livros infantis com uma identidade visual uniforme ou materiais de marketing de marca.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar