Pantera e Franklin Templeton juntam-se à Sentient Arena para testar conjuntamente o desempenho de agentes de IA empresariais

PANews 27 de fevereiro de notícias, de acordo com a Cointelegraph, o laboratório de IA de código aberto Sentient anunciou o lançamento do Arena, um ambiente de teste de produção para avaliar o desempenho de agentes de IA em fluxos de trabalho empresariais. A Pantera Capital e o departamento de ativos digitais da Franklin Templeton juntaram-se às primeiras equipes de teste do Arena. Sentient afirmou que o Arena não é um teste de modelos estáticos, mas sim uma avaliação padronizada de tarefas de IA através da simulação de condições empresariais que incluem documentos longos, informações incompletas e fontes conflitantes. A plataforma monitora categorias de falhas como alucinações, falta de evidências, citações incorretas e vulnerabilidades de raciocínio, ajudando os desenvolvedores a diagnosticar problemas. O Arena planeja publicar indicadores de desempenho comparativos por meio de uma classificação pública e divulgar relatórios de teste que resumem padrões comuns de falhas e soluções de correção.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Supremacia da Encriptação: Zcash e Privacidade na Era da Escala

O ensaio discute os progressos na aprendizagem automática para a classificação de transacções de Bitcoin, destaca a utilização crescente das transacções protegidas da Zcash e descreve o crescimento da liquidez descentralizada ao contornar o KYC. Também aborda as iniciativas pós-quantum da Zcash e a sua recente reestruturação organizacional.

CoinDesk23m atrás

Aave perde o seu gestor de risco principal, a Chaos Labs, no meio de uma saída de colaboradores e de disputas

A Chaos Labs está a sair da Aave, destacando tensões internas face à estratégia em evolução do protocolo e uma falta de alinhamento na gestão de risco. Apesar do seu historial de sucesso, a empresa cita economias insustentáveis e o aumento da complexidade operacional como razões para a saída, levantando preocupações sobre a futura gestão de risco da Aave.

CoinDesk43m atrás

A Polymarket revela uma «atualização completa da exchange» para assumir o controlo das suas próprias negociações e da verdade

A Polymarket planeia lançar um novo token de colateral indexado ao USDC, o Polymarket USD, como parte de uma actualização abrangente da plataforma. Esta medida visa melhorar o controlo sobre a liquidação e a liquidez. A possível introdução de um token POLY para governação poderia ainda reforçar a integridade do mercado, na sequência de controvérsias no seu sistema de governação actual.

CoinDesk1h atrás

Io.net Visa Custos de Cloud de IA com uma Rede Descentralizada de GPUs

A Io.net oferece uma solução descentralizada para computação de IA, abordando os custos crescentes enfrentados pelos programadores. Fornece capacidade de GPU acessível e sob demanda, com o objetivo de colmatar a diferença para inovadores mais pequenos num mercado dominado por elevados investimentos.

BlockChainReporter1h atrás

A Polymarket lançará o seu motor de negociação V2 e a stablecoin nativa Polymarket USD no prazo de 2-3 semanas.

Anúncio da Polymarket: irá realizar grandes atualizações nas próximas 2-3 semanas, incluindo a reestruturação do motor de negociação, a introdução do Polymarket USD e a otimização da eficiência de correspondência. Esta atualização é a maior escala desde o lançamento da plataforma, e irá melhorar a eficiência das transações e reduzir a preocupação dos utilizadores com ativos não oficiais.

GateNews1h atrás

Os principais contribuintes da Aave DAO, a Chaos Labs, anunciam a saída

Notícias do Gate News, mensagem de governação: com base na mensagem de governação, o principal contribuinte, a Chaos Labs, saiu do Aave DAO. Anteriormente, a BGD e a ACI já tinham deixado esta organização DAO.

GateNews2h atrás
Comentar
0/400
Nenhum comentário