さて、ここで推論にどのように意味があるのかというと、私たちはH200で量子化されたQ8 Qwen Coder 3およびKimi K2インスタンスをほとんど収容できませんでした。Kimi K2 @ Q8はコンテキストのkvキャッシュの余地を残しませんでした。これらのモデルは単一の8xB200インスタンスに収まるでしょうか?おそらく、今週試してみます。

LL2.15%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 4
  • 共有
コメント
0/400
HallucinationGrowervip
· 59分前
なんでこんなに派手にする必要があるのか
原文表示返信0
TerraNeverForgetvip
· 1時間前
これ、強制清算されるんじゃないの?
原文表示返信0
FadCatchervip
· 1時間前
このkvキャッシュスペースはどうして使い切ったのですか
原文表示返信0
FloorSweepervip
· 1時間前
グラフィックカードが入らないので、何をしているのですか?
原文表示返信0
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)