Como usar o ChatGPT Imagens 2.0? Teste prático de menu de macarrão com carne, capa de revista, efeito de divulgação em vários idiomas

robot
Geração do resumo em andamento

OpenAI lança a ferramenta de imagens ChatGPT 2.0, com foco em capacidades poderosas de layout complexo e processamento de textos multilíngues (incluindo chinês), este artigo apresentará uma visão completa das funcionalidades do Images 2.0, suas características, planos gratuitos e pagos, além de resultados de geração prática.

O que é o ChatGPT Images 2.0? Conheça suas principais funções e características!

Uma ferramenta de geração de imagens AI capaz de competir com o Gemini Nano Banana 2 chegou? OpenAI anunciou o lançamento do ChatGPT Images 2.0, alimentado pelo novo modelo GPT Image 2, que destaca a habilidade de selecionar, organizar e revelar informações em imagens. A seguir, as 3 principais características do ChatGPT Images 2.0:

Processamento avançado de layout e textos multilíngues

Primeiramente, uma característica bastante evidente é a significativa melhoria na capacidade de layout e processamento de textos multilíngues do ChatGPT Images 2.0.

Segundo a mídia especializada Techcrunch, as ferramentas de geração de imagens AI anteriores geralmente utilizavam modelos de difusão, que frequentemente enfrentavam dificuldades na escrita de textos. O ChatGPT Images 2.0 consegue apresentar detalhes minuciosos, como textos pequenos, ícones e interfaces de usuário, com alta precisão.

A OpenAI afirma que o Images 2.0 apresenta avanços notáveis no processamento de idiomas que usam alfabetos não latinos, incluindo chinês, japonês, coreano, hindi e bengali, podendo gerar esses textos com altíssima clareza nas imagens.

Fonte: Exemplos oficiais gerados pelo ChatGPT Images 2.0 da OpenAI

Capacidade de raciocínio renovada e busca na internet

Além do processamento de layout e textos multilíngues, o ChatGPT Images 2.0 oferece uma nova capacidade de raciocínio, podendo buscar informações na internet em tempo real para ajudar na geração de imagens. O banco de dados do modelo é atualizado até dezembro de 2025, auxiliando na criação de conteúdos relacionados a eventos recentes.

Fonte: Exemplos oficiais gerados pelo ChatGPT Images 2.0 da OpenAI

Suporte a resolução 2K e proporções variadas

O ChatGPT Images 2.0 suporta geração de imagens com resolução de até 2K e oferece uma gama mais ampla de proporções, desde 3:1 para imagens panorâmicas até 1:3 para imagens verticais.

O responsável pela pesquisa da OpenAI, Boyuan Chen, afirmou que a arquitetura do Images 2.0 foi completamente reformulada, sendo um modelo universal que, com comandos de texto simples, consegue lidar com mudanças de perspectiva em estilo 3D e raciocínio espacial complexo.

Funcionalidades dos planos gratuitos e pagos do ChatGPT Images 2.0

Dinheiro bem investido? Usuários de diferentes níveis de assinatura do ChatGPT Images 2.0 podem desbloquear funcionalidades distintas, listadas a seguir:

  • Usuários gratuitos: atualmente podem usar o modelo básico ImageGen 2.0 para tarefas padrão de geração de imagens. A versão básica já inclui várias melhorias essenciais, como melhor aderência às instruções, efeitos de renderização de texto mais robustos, suporte multilíngue e maior variedade de proporções.
  • Usuários do ChatGPT Plus, Business e Enterprise: esses assinantes podem ativar o novo modo de raciocínio. Nesse modo, o gerador de imagens do chatbot utiliza busca na internet, cria diagramas visuais a partir de arquivos enviados pelo usuário e realiza raciocínio estrutural antes de gerar as imagens. É possível gerar até 8 imagens simultaneamente, garantindo consistência nos personagens, objetos e estilos de cada cena.
  • Usuários Pro: terão acesso ao modelo ImageGen Pro mais avançado. Embora a OpenAI ainda não tenha detalhado as diferenças exatas entre Pro e o modo de raciocínio, para empresas, essa funcionalidade pode ser vista como uma atualização de recursos, útil para tarefas que exigem fatos verificáveis, conversão de documentos internos em diagramas explicativos ou manutenção de consistência visual entre múltiplos ativos.
  • Desenvolvedores de API: agora podem integrar o modelo gpt-image-2, suportando alta resolução e configurações flexíveis de proporções.

Testes do ChatGPT Images 2.0: menus, revistas, gráficos explicativos

Como o desempenho real do ChatGPT Images 2.0 corresponde às promessas da OpenAI? Vamos testar.

Teste de menu de restaurante de carne bovina

Um editor do “Crypto City” testou a versão gratuita do ChatGPT, criando um menu de carne bovina taiwanês, com a seguinte instrução: “Por favor, gere um menu focado em pratos de carne bovina taiwanesa, usando chinês tradicional, incluindo nomes, preços e imagens de cada prato.”

A seguir, o resultado gerado:

Fonte: Imagem gerada pelo ChatGPT Images 2.0

Para o conteúdo gerado na versão gratuita, o resultado parece razoável à primeira vista, mas ao observar com mais atenção, nota-se que o Images 2.0 ainda apresenta erros de escrita em caracteres tradicionais mais complexos, possivelmente uma melhoria na versão paga.

Além disso, o resultado aproxima-se dos preços de carne bovina em Taipei, e ainda permite uma porção extra gratuita para consumo no local.

Porém, se você pretende imprimir o menu, o ideal é converter as imagens geradas pelo ChatGPT Images 2.0 em arquivos vetoriais (como EPS, .ai do Adobe Illustrator ou PDF) usando o modo CMYK, para uma impressão de melhor qualidade. Embora as gráficas possam aceitar JPG ou PNG, para resultados profissionais, ajustes adicionais podem ser necessários.

Teste de capa de revista de tecnologia

Em seguida, testamos uma capa de revista de ficção científica, usando a mesma abordagem de processamento de layout complexo. A instrução foi: “Por favor, gere uma capa de revista de tecnologia em chinês tradicional, com o nome ‘Crypto City’, tema ‘Encontro entre Blockchain e IA’, incluindo título, volume, código de barras e data de validade na parte superior, com textos claros e alinhados de forma profissional.”

A seguir, o resultado:

Fonte: Imagem gerada pelo ChatGPT Images 2.0

Esse resultado é semelhante ao anterior, aparentando estar bom à primeira vista, mas ao analisar detalhes, ainda há falhas na escrita de caracteres chineses complexos. Além disso, a fonte da capa lembra bastante a “Jin Xuan” da Justfont, uma fonte taiwanesa, levantando dúvidas sobre possível licença.

Dúvidas semelhantes já foram levantadas quando o “Crypto City” lançou o Nano Banana Pro.

  • Reportagem relacionada: Teste do Nano Banana Pro: avanços nos caracteres chineses! Mas surgem dúvidas sobre direitos de animação e fontes

Teste de gráficos explicativos multilíngues

O “Crypto City” também testou um gráfico de causa de terremoto em chinês tradicional, japonês e coreano, com textos multilíngues complexos, que tiveram uma renderização geral bem-sucedida. Na disposição, diferentes cores foram usadas para distinguir os idiomas, embora, ao observar de perto, alguns caracteres chineses, kanji ou coreanos mais complexos ainda apresentem alguma borradura.

A seguir, o resultado:

Fonte: Imagem gerada pelo ChatGPT Images 2.0

Images 2.0 mantém consistência de personagens e objetos, resolvendo processos complicados

Além disso, o Images 2.0, assim como o Nano Banana 2, possui capacidade de edição. Basta clicar em “Editar” no canto inferior esquerdo da imagem gerada para começar a modificar, mantendo a consistência de personagens e objetos, facilitando a criação de páginas de quadrinhos, séries de posts para redes sociais ou plantas de design de cômodos de casas.

A gerente de produto do ChatGPT Images, Adele Li, afirmou que essa funcionalidade resolve o antigo problema de usuários que precisavam gerar uma imagem de cada vez e montar manualmente, permitindo que criadores desenvolvam livros infantis com identidade visual uniforme ou materiais de marketing de marca de forma mais fácil.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar