O Treinamento de IA é onde as coisas ficam interessantes, especialmente para redes de treinamento distribuídas, elas estão treinando modelos que são menores do que as GPUs em que estão treinando. A maioria das redes está fazendo treinamento de modelos de 1,5B, 3B e 8B para que caibam em GPUs de consumo.
Ver original