Gate News bot 消息,MiniMax6月17日宣布將連續五天發布重要更新。今天第一彈是開源首個推理模型MiniMax-M1。
根據官方的報告,MiniMax-M1多項基準測試比肩DeepSeek-R1、Qwen3等開源模型,接近海外的最領先模型。
官方博客還提到,基於兩大技術創新,MiniMax-M1訓練過程高效得“超出預期”,只用了3周時間、512塊H800 GPU就完成強化學習訓練階段,算力租賃成本僅53.47萬美元。這比一開始的預期少了一個數量級。
消息來源:金十
9.5萬 熱度
1.1萬 熱度
6032 熱度
17.1萬 熱度
5.6萬 熱度
MiniMax開源首個推理模型:對標DeepSeek,算力成本僅約53萬美元
Gate News bot 消息,MiniMax6月17日宣布將連續五天發布重要更新。今天第一彈是開源首個推理模型MiniMax-M1。
根據官方的報告,MiniMax-M1多項基準測試比肩DeepSeek-R1、Qwen3等開源模型,接近海外的最領先模型。
官方博客還提到,基於兩大技術創新,MiniMax-M1訓練過程高效得“超出預期”,只用了3周時間、512塊H800 GPU就完成強化學習訓練階段,算力租賃成本僅53.47萬美元。這比一開始的預期少了一個數量級。
消息來源:金十