Google lança algoritmo TurboQuant: quantização KV cache de 3 bits sem perda de precisão, velocidade de inferência aumenta até 8 vezes

Notícias do Gate News, a 25 de março, o Google Research lançou o algoritmo de compressão quântica TurboQuant, que consegue comprimir o cache KV de grandes modelos de linguagem para 3 bits, reduzindo o uso de memória pelo menos 6 vezes, sem necessidade de treino ou ajuste fino, sem perder precisão do modelo. No modo de 4 bits, a velocidade de cálculo de atenção na GPU Nvidia H100 é até 8 vezes superior à linha de base de 32 bits não quantificados. A equipe de pesquisa validou o TurboQuant usando modelos Gemma e Mistral em benchmarks de contexto longo como LongBench, Needle In A Haystack e ZeroSCROLLS, alcançando desempenho ótimo em todos os testes. O algoritmo é composto por duas subferramentas: PolarQuant, que elimina o custo de memória das quantizações tradicionais por meio de transformação em coordenadas polares, e QJL, que corrige o erro residual usando apenas 1 bit. A pesquisa foi liderada por Amir Zandieh do Google Research e Vahab Mirrokni, vice-presidente e Google Fellow, em colaboração com KAIST na Coreia do Sul e a Universidade de Nova York, e será apresentada na ICLR 2026. O Google afirmou que uma das principais aplicações dessa tecnologia é resolver o gargalo do cache KV em modelos como Gemini.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Relatório mais recente da A16z: Por que a blockchain é a infraestrutura que falta para os agentes de IA?

a16z crypto relatório mais recente indica que agentes de IA estão se transformando de ferramentas auxiliares em agentes de comportamento econômico, porém ainda existem grandes lacunas em infraestrutura central como identidade, pagamentos e colaboração entre plataformas. O relatório destaca que, à medida que a IA participa da governança e das transações, os mecanismos de verificação se tornam a chave para a confiança; a tecnologia blockchain pode fornecer uma infraestrutura verificável para enfrentar esses desafios. No futuro, será necessário, por meio de mecanismos criptográficos, garantir que os agentes de IA realmente representem a vontade dos usuários e modificar os sistemas de pagamento tradicionais.

ChainNewsAbmedia2h atrás

Três grandes plataformas controlam 75% do mercado de futuros perpétuos de ações no 1º trimestre de 2026

O relatório do 1º trimestre de 2026 da TokenInsight revela que o mercado de futuros perpétuos de ações é dominado por algumas das principais plataformas, que juntas detêm cerca de 75% de participação de mercado. As principais bolsas estão cada vez mais oferecendo produtos de ações e finanças dos EUA para aprimorar a negociação entre classes de ativos.

GateNews8h atrás

Hedging entre Ativos Surge como Estratégia de Corrente Principal, Relatório do 1º Trimestre Mostra

Um relatório da Block Scholes revela correlações crescentes entre criptoativos e mercados tradicionais, observando aumento na demanda por plataformas de negociação unificadas à medida que traders gerenciam ativos diversos. Os volumes de negociação dispararam, refletindo uma mudança para estratégias de múltiplos ativos.

GateNews9h atrás

Produtos de Investimento em Ativos Digitais Registram US$ 1,4B em Entradas Líquidas na Última Semana, Maior Nível Desde Janeiro

A CoinShares reportou US$ 1,4 bilhão em entradas líquidas para produtos de investimento em ativos digitais na última semana, marcando o maior aumento desde janeiro. O Bitcoin liderou com US$ 1,116 bilhão, enquanto o Ethereum viu $328 milhões de entrada. Os EUA contribuíram significativamente, embora a Suíça tenha registrado saídas.

GateNews9h atrás

Hackers de DeFi roubam US$ 600 milhões em abril; Kelp DAO e Drift respondem por 95% das perdas mensais

Em abril de 2026, apenas dentro de 20 dias, acordos cripto registraram perdas superiores a US$ 606 milhões devido a ataques de hackers, tornando-se o pior recorde de perdas mensais desde o incidente de vazamento de dados de US$ 1,4 bilhão em fevereiro de 2025 envolvendo exchanges. Os dois ataques, KelpDAO e Drift Protocol, somaram 95% das perdas de abril, e 75% das perdas totais de US$ 771,8 milhões até o momento em 2026.

MarketWhisper13h atrás

Moody's: Mercado de Stablecoins Passa de US$ 315,8B, mas a Ameaça aos Bancos no Curto Prazo Permanece Limitada

O relatório da Moody's mostra que as stablecoins atingiram um valor de mercado de US$ 315,8 bilhões, sendo dominadas principalmente pela USDT. Embora os riscos de curto prazo para os bancos sejam limitados devido à adoção restrita e à regulação, o crescimento de longo prazo pode desafiar a banca tradicional.

GateNews14h atrás
Comentário
0/400
Sem comentários