Recentemente, a NVIDIA fechou uma jogada interessante no mercado de inferência.


Adquiriu o negócio de chips da Groq por 200 mil milhões de dólares, trazendo a equipa-chave liderada por Jonathan Ross.
O que é curioso é que a Groq continua a operar como uma empresa independente, portanto não é uma aquisição total.

O que me chamou a atenção foi a explicação de Huang Renxun sobre por que fizeram isto.
Acontece que o mercado de inferência não é monolítico.
Antes, tudo girava em torno de extrair mais desempenho, ponto.
Mas agora as coisas mudaram.
Os utilizadores estão dispostos a pagar preços diferentes consoante a velocidade de resposta.
Se um engenheiro consegue processar tokens mais rapidamente e ser mais produtivo, está disposto a investir nisso.

É aí que entra a Groq.
A sua arquitetura LPU é conhecida por latências determinísticas baixas, o oposto do que a NVIDIA faz com as suas GPUs de alto desempenho.
É como se estivessem a completar um espectro: por um lado, desempenho máximo; por outro, velocidade máxima de resposta.
Dois segmentos do mercado, dois preços diferentes, mesmo modelo.

Na conferência GTC de março, lançaram o Groq 3 LPU com processo de 4 nm da Samsung.
Os números são impressionantes: 35 vezes mais eficiência em inferência por megavatio comparado com o Blackwell NVL72.
É o tipo de diferenciação que abre novos mercados em vez de apenas competir no existente.

A jogada da Groq aqui é clara: enquanto a NVIDIA domina o alto desempenho, eles especializam-se naquilo que os utilizadores que valorizam a velocidade acima de tudo precisam.
Duas estratégias, um ecossistema mais completo.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar