Karpathy: A perceção das capacidades da IA apresenta uma falha grave; a versão gratuita e o Agent de ponta são «produtos completamente diferentes»

O antigo diretor-geral de IA da Tesla e membro fundador da OpenAI, Andrej Karpathy, publicou um longo texto no X no dia 9 de abril, afirmando que a perceção do público sobre as capacidades da IA está a dividir-se gravemente. Segundo ele, as pessoas que usam o ChatGPT na versão gratuita e os técnicos que usam diariamente ferramentas de agentes de ponta como Codex e Claude Code estão, na prática, a discutir “produtos completamente diferentes”, mas ambos os lados acreditam que estão a ver a totalidade do que é a IA.

Dois mundos, duas perceções de IA

Karpathy divide os utilizadores atuais de IA em dois grupos.

O primeiro grupo experimentou a versão gratuita do ChatGPT em algum momento do ano passado e formou com isso a sua perceção global da IA. O que veem são vários erros do modelo — alucinações, resultados de pesquisa absurdos e até falhas em problemas simples, como “devo conduzir ou ir a pé para lavar o carro” no modo de voz. Karpathy reconhece que estes problemas de facto existem, mas sublinha que a versão gratuita e modelos desatualizados não conseguem representar com fidelidade as capacidades reais dos modelos de agentes de ponta até 2026.

O segundo grupo cumpre simultaneamente duas condições: usa, com pagamento, os mais recentes modelos de agentes de ponta (como OpenAI Codex ou Claude Code) e recorre a eles de forma profissional em áreas técnicas como desenvolvimento de software, matemática e investigação. Karpathy chama a este grupo um estado de “psicose de IA” altamente intenso, porque os progressos recentes destes modelos nas áreas técnicas “só podem ser descritos como surpreendentes” — é possível ver, literalmente, como resolvem em uma hora problemas de arquitetura de programação que antes exigiam dias ou até semanas.

Porque o progresso se concentra nas áreas técnicas

Karpathy explica porque é que a melhoria nas capacidades de IA é especialmente marcante em áreas técnicas como desenvolvimento de programação, mas menos evidente em usos gerais como pesquisa, escrita e recomendações.

Existem duas razões: primeiro, as áreas técnicas fornecem funções de recompensa verificáveis (por exemplo, se os testes unitários passam), o que permite que o treino por aprendizagem por reforço funcione de forma eficaz; em contrapartida, é difícil determinar de forma clara a qualidade de um texto. Segundo, as áreas técnicas têm mais valor comercial em cenários B2B, por isso as empresas de IA investem a maior parte dos recursos das suas equipas nessas direções.

Estes dois grupos não se conseguem entender

Karpathy conclui que estes dois grupos estão a “falar entre si”. O modo de voz da versão gratuita da OpenAI falha em problemas do dia a dia, enquanto o Codex da versão paga mais avançada da OpenAI consegue, em uma hora, reestruturar toda a base de código ou detetar vulnerabilidades do sistema — e ambas as coisas são verdade ao mesmo tempo.

Nas suas respostas subsequentes, ele acrescentou que alguém lhe apresentou uma perspetiva: o incidente do OpenClaw atraiu tanta atenção social precisamente porque fez com que muitos não especialistas em tecnologia tivessem contacto pela primeira vez com os modelos de agentes mais recentes, e essas pessoas até então só sabiam que IA era sinónimo de ChatGPT na versão web.

Este artigo de Karpathy: a perceção das capacidades de IA apresenta uma rutura grave, a versão gratuita e os agentes de ponta são “produtos completamente diferentes” apareceu pela primeira vez em Cadeia de Notícias ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

O QClaw internacional da Tencent inicia testes em fase beta, com 700 dólares em tokens para os usuários do Japão entrarem primeiro na fila

O produto de agentes de IA da QClaw, da equipe do Tencent PC Manager, anunciou em 20 de abril que a versão internacional foi oficialmente aberta para testes em fase inicial. A primeira leva abrange os Estados Unidos, Canadá, Singapura e Coreia do Sul, com suporte a vários idiomas, como chinês, inglês, francês, espanhol e coreano. Durante o período de testes, serão oferecidos diariamente 40 milhões de Tokens, ao mesmo tempo em que serão abertos os primeiros 20.000 lugares para “Founding Claw (創始龍蝦)”, por ordem de chegada.

MarketWhisper2h atrás

Adobe Lança Suíte de IA CX Enterprise para Automatizar o Marketing Corporativo com Parcerias da OpenAI e da Anthropic

A Adobe apresentou a CX Enterprise, uma suíte de IA voltada a automatizar e personalizar o marketing digital para empresas. Ela se integra às principais plataformas e está sendo adotada por agências de publicidade líderes para aprimorar as interações com clientes e melhorar o desempenho de marketing.

GateNews6h atrás

Dark Matter Labs lança e disponibiliza em código aberto o modelo Kimi K2.6

A Dark Matter Labs lançou o modelo Kimi K2.6, com melhorias no código de longo contexto e execução autônoma aprimorada. Ele já está disponível em várias plataformas para todos os usuários.

GateNews7h atrás

Relatório mais recente da A16z: Por que a blockchain é a infraestrutura que falta para os agentes de IA?

a16z crypto relatório mais recente indica que agentes de IA estão se transformando de ferramentas auxiliares em agentes de comportamento econômico, porém ainda existem grandes lacunas em infraestrutura central como identidade, pagamentos e colaboração entre plataformas. O relatório destaca que, à medida que a IA participa da governança e das transações, os mecanismos de verificação se tornam a chave para a confiança; a tecnologia blockchain pode fornecer uma infraestrutura verificável para enfrentar esses desafios. No futuro, será necessário, por meio de mecanismos criptográficos, garantir que os agentes de IA realmente representem a vontade dos usuários e modificar os sistemas de pagamento tradicionais.

ChainNewsAbmedia14h atrás

Moonshot AI lança o Kimi K2.6 com recursos aprimorados de codificação e Agent

Moonshot AI lançou o Kimi K2.6, com modos de chat e Agent no kimi.com. Ele se destaca em benchmarks de codificação, suporta 4.000 invocações de ferramentas e aprimorou a funcionalidade paralela para cenários autônomos.

GateNews16h atrás

As Smart Actions da Nexchain levam IA para a Web3 autônoma

A Nexchain introduziu as Smart Actions, uma suíte de módulos inteligentes projetados para transformar redes blockchain de sistemas manuais e reativos em ambientes autônomos e auto-otimizáveis, de acordo com um comunicado em 18 de abril de 2026. O produto reflete o compromisso da empresa com a construção de

CryptoFrontier18h atrás
Comentário
0/400
Sem comentários