O Claude Code conquista o primeiro lugar na maratona de hackers com investigação de automação! Vencedor: eu nem sequer sabia como vencer

No Hackathon de Autoresearch organizado pela Paradigm, um(a) participante que, praticamente, não “concebeu estratégias pessoalmente”, acabou por vencer o torneio. O vencedor Ryan Li, que também é CEO da SurfAI, afirma que todo o processo de resolução ficou quase totalmente a cargo da IA, que ele próprio “nem sabe como é que venceu”, e ainda assim conseguiu o primeiro lugar no Prediction Market Challenge.

Esta competição exige que os participantes desenhem uma estratégia de market making num mercado de previsão binário simulado, fornecendo liquidez no livro de ordens através de ordens limitadas e equilibrando o lucro entre “arbitradores” e o fluxo de retalho. A classificação final é calculada com base na edge média (vantagem de lucro) em 200 simulações aleatórias. O resultado final de Ryan foi de 42,32 USD de mean edge (calculado pela mediana de três grupos de sementes aleatórias) e, após a reavaliação, subiu ao primeiro lugar.

Claude Code + Codex pesquisa automática, produz 1.039 estratégias

Ao contrário das estratégias de trading quantitativo tradicional ou de market making que dependem de ajustes e modelação por especialistas humanos, Ryan adoptou a abordagem do “Bitter Lesson” proposta por Rich Sutton nos últimos anos, fazendo com que a capacidade de computação e o tamanho da pesquisa superem a experiência humana. Ele transformou todo o problema num processo de “pesquisa automatizada” (autoresearch), explorando em paralelo o espaço de possíveis soluções por meio de múltiplos agentes de IA, em vez de optimização manual.

Durante todo o processo, ele utilizou entre 8 e 20 agentes de IA em execução paralela (principalmente com base em Claude Code, com apoio do Codex). Cada agente ficou responsável por diferentes hipóteses e espaços de parâmetros, gerando continuamente estratégias, executando simulações e devolvendo os resultados. No fim, acumulou a produção de 1.039 variações de estratégias, realizou mais de 2.000 avaliações e gerou automaticamente 47 scripts de varrimento de parâmetros. O tamanho global da pesquisa, por outras palavras, equivale a comprimir semanas de experiências manuais para apenas algumas horas.

Algoritmo de market making em Python com 900 linhas gerado por IA conquista o primeiro lugar no hackathon

Ao nível da estratégia, a solução final vencedora é um algoritmo de market making com cerca de 900 linhas de Python; a lógica central não provém de um único desenho, mas sim da combinação de múltiplos módulos “validados como eficazes”. Inclui evitar zonas de spread extremamente estreitas em que os arbitradores ganham de forma definitiva, estimar o preço real através da teoria da informação, ajustar dinamicamente a dimensão da cotação com base no risco de arbitragem e entrar proactivamente no mercado para conquistar zonas de maior lucro quando as ordens do livro do adversário forem “comidas” (consumidas).

A突破 mais crítica, no entanto, vem de um agente de IA que, pela primeira vez, “abandona totalmente estratégias existentes e começa do zero”. Quando a optimização estagnou em cerca de +25 edge, esse agente descobriu de forma independente um modelo de sizing com base na “probabilidade de risco de arbitragem”, elevando o desempenho da estratégia de uma só vez para +44, tornando-se o ponto de viragem de toda a competição. Este resultado também valida directamente a metodologia de Ryan: quando a pesquisa fica presa num ótimo local, reiniciar é mais eficaz do que afinar.

A vantagem absoluta da pesquisa em IA: tentativas automatizadas

Na conclusão, Ryan indica que o ponto-chave desta competição não é conceber uma “estratégia inteligente”, mas sim construir um sistema que consiga fazer uma pesquisa em grande escala, validar ideias e eliminá-las. Em vez de depender da intuição humana, deixa-se que a IA faça tentativas num enorme espaço de soluções e se aumente a eficiência através da paralelização e da automatização.

Este caso reforça ainda mais a mudança do papel da “Agentic AI” nos processos de engenharia e de investigação: a IA deixa de ser apenas uma ferramenta de apoio e pode assumir directamente a unidade principal de execução para exploração e tomada de decisão. Em alguns problemas altamente estruturados e simuláveis, os humanos podem até sair completamente do papel de “resolvedores” e, em vez disso, desenhar a própria estrutura de pesquisa e os mecanismos de avaliação.

Este artigo: a pesquisa automatizada do Claude Code vence o hackathon! Vencedor: eu literalmente não sei como é que ganhei, apareceu pela primeira vez em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Polymarket Sofre Análise por Vencer Mercado de Previsão do $37K Clima de Paris

Mensagem do Gate News, 23 de abril — Duas contas na Polymarket, uma plataforma de mercado de previsões, estão sendo analisadas após ganharem aproximadamente US$ 37.000 com mercados ligados a leituras de temperatura no Aeroporto Charles de Gaulle, em Paris. Foram levantadas dúvidas sobre se picos suspeitos nos dados oficiais

GateNews47m atrás

Delphi, mercado de previsão de IA, é lançado na mainnet da Gensyn

Mensagem de Notícias da Gate, 23 de abril — O protocolo de mercado de previsão de IA Delphi foi oficialmente lançado na Gensyn, um protocolo de computação de IA, permitindo que humanos e agentes de IA realizem negociações de previsões na mesma plataforma. A liquidação é concluída on-chain por meio de oráculos de IA verificados. A Gensyn lançou anteriormente a Delphi em sua testnet em dezembro de 2025.

GateNews47m atrás

Polymarket lança mercado de previsão de aquisição da SpaceX do Cursor, probabilidades de "sim" em 74%

Mensagem de notícias do Gate, 23 de abril — A Polymarket lançou um novo contrato de mercado de previsão perguntando se a SpaceX adquirirá o Cursor, com as probabilidades de "sim" atualmente em 74%, de acordo com monitoramento da Odaily Seer. O mercado será resolvido como "sim" se o Cursor anunciar uma fusão com ou uma aquisição por S

GateNews48m atrás

Kalshi Multa Três Candidatos ao Congresso dos EUA por Atraso de Aposta de Campanha Própria

A plataforma de mercados de previsão Kalshi multou e suspendeu três candidatos ao Congresso dos EUA por apostarem nos resultados de suas próprias campanhas, enquanto a empresa intensifica a aplicação de controles contra negociação com informação privilegiada. As ações de fiscalização miram Mark Moran (candidato ao Senado de Virgínia), Matt Klein (Minnes

CryptoFrontier2h atrás

Bitcoin Toca $80K em Abril no Polymarket, Probabilidades sobem para 54%

Mensagem da Gate News, 23 de abril — No Polymarket, a probabilidade de o Bitcoin tocar US$ 80.000 durante abril subiu para 54%, com o volume de negociações no contrato chegando a aproximadamente US$ 39,36 milhões. O mercado de previsões está definido para liquidar em 1º de maio às 11:59

GateNews2h atrás

Kalshi Lança Commodities Hub Com Pyth Como Provedor de Dados para os Mercados de Petróleo, Ouro e Lítio

Mensagem da Gate News, 23 de abril — A plataforma de mercados de previsão Kalshi fez uma parceria com o protocolo de oráculo cripto Pyth como provedor de dados para seu recém-lançado Commodities Hub, uma interface que permite aos usuários negociar opções binárias sobre commodities, incluindo petróleo Brent, ouro, lítio e grãos de soja. A Pyth vai servir como fonte de resolução para esses mercados.  O Commodities Hub foi ao ar na quarta-feira, com dezenas de mercados ativos estruturados em torno de metas de preço específicas. Os usuários podem fazer apostas sobre se os preços das commodities vão ser negociados acima ou abaixo de níveis predeterminados. O chefe de cripto da Kalshi, John Wang, declarou: "À medida que a bolsa aprofunda nossas ofertas em commodities líquidas, é importante que os mercados da Kalshi sejam respaldados por dados rápidos e de nível institucional. As feeds de preços da Pyth são detalhadas e fáceis de consumir, complementando a missão da Kalshi de tornar esses mercados acessíveis a um conjunto mais amplo de participantes do varejo e do setor institucional."  A Pyth agrega feeds de preço de mais de 125 instituições, incluindo exchanges e formadores de mercado, permitindo a descoberta de preços 24/7 entre classes de ativos. O CEO da empresa de P&D da Pyth, Douro Labs, Mike Cahill, observou: "Os mercados de commodities estão sendo cada vez mais moldados por desenvolvimentos geopolíticos ao longo do dia, e os participantes do mercado precisam de descoberta de preços que não pare quando as exchanges tradicionais fecham." O mercado de óleo mais líquido da Kalshi, com aproximadamente milhões em volume de negociação, usará dados da ICE para verificação do resultado. A iniciativa reflete o interesse crescente em mercados de previsão à medida que as plataformas expandem a negociação de commodities além dos horários tradicionais de funcionamento em dias úteis.  Mais cedo neste mês, a Polymarket anunciou uma integração semelhante com a Pyth para mercados de commodities, usando também a Chainlink como oráculo. Ambas as plataformas competem intensamente por participação de mercado e parcerias de dados. A Kalshi foi avaliada em bilhão em março, enquanto a Polymarket está captando capital em uma avaliação de bilhão. Os desafios regulatórios persistem: a CFTC afirma que os mercados de previsão se enquadram sob sua jurisdição, mas reguladores estaduais questionaram essas operações citando leis de jogos de azar. Os senadores dos EUA Adam Schiff e John Curtis apresentaram o 'Prediction Markets Are Gambling Act', visando apostas esportivas, e alguns países, incluindo a Argentina, estão se movendo para bloquear o acesso. O token PYTH ganhou mais de 6% para US$ 0,048 com a notícia, enquanto o bitcoin subiu mais de 4% para US$ 79.000.

GateNews6h atrás
Comentário
0/400
Sem comentários