L'entraînement des IA est là où cela devient intéressant, surtout pour les réseaux d'entraînement distribués, ils entraînent des modèles qui sont plus petits que les GPU sur lesquels ils s'entraînent. La plupart des réseaux effectuent un entraînement de modèles de 1,5B, 3B et 8B afin qu'ils s'adaptent aux GPU grand public.
Voir l'original