Ця компанія пропонує LLM, швидкість виводу якого така висока, що димить, і може досягати щонайменше 1500 токенів/секунду!



Яка концепція? На діаграмі, представленій постачальником моделі qwen3 coder від openrouter, середня пропускна здатність cerebras становить 1650tok/s, що в 17 разів більше, ніж у другого місця з 92tok/s.

Згідно з цією пропускною здатністю, у сфері кодування за кілька секунд можна видати тисячі рядків коду!

Основна конкурентоспроможність цієї компанії полягає в розробленій власноруч технології чіпів. На малюнку 2 представлено порівняння швидкості висновку їхніх чіпів та традиційних GPU👇
Переглянути оригінал
post-image
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити