"GPU"的搜尋結果
2026-04-30
02:01

摩爾線程轉為Q1盈利4.3M美元,營收同比飆升155%

Gate News 訊息,4月27日——摩爾線程科技在2026年第一季度錄得淨利29.4百萬元人民幣 (US$4.3 million),扭轉上年同期112.5百萬元人民幣 (US$16.45 million)的虧損。這家總部位於北京的GPU製造商Q1營收同比飆升155%至737.6百萬元人民幣
展開
05:21

DeepSeek V4 引爆美國辯論:智庫質疑晶片使用,Replit 執行長為開放創新辯護

Gate News 訊息,4 月 24 日——美國就 DeepSeek V4 的技術能力與合規性引發了爭論。Chris McGuire,外交關係委員會 (CFR) 的資深研究員,以及曾任白宮國家安全委員會與國防部官員,發表了分析,主張 V4 並未改變美中 AI 的競爭格局。據 McGuire 稱,DeepSeek 自己的 V4 報告承認,其推理能力較前沿模型落後約 3 到 6 個月,基準測試對標的是六個月前發布的 GPT-5.2 與 Gemini 3.0 Pro。 McGuire 對此表示擔憂:雖然 V4 報告披露了在推論階段對 NVIDIA GPU 與 Huawei Ascend NPU 的適配,但並未公開指定開發期間使用的 GPU 型號或訓練成本。他質疑這種沉默是否意味著使用了受出口管制的 NVIDIA Blackwell 晶片,並指出 V3 先前曾聲稱使用了 2,000 張 H800 GPU,成本為 5.57 百萬美元。DeepSeek 已否認使用 Blackwell,稱該模型是在 NVIDIA H800 與 Huawei Ascend 910C 處理器上訓練。 Replit 執行長 Amjad Masad 反駁了 McGuire 的分析,認為中國科學家正在公開分享真正的 AI 突破,而美國的政策制定者與遊說者則放大了「中國蒸餾」的疑慮。Masad 強調 DeepSeek 官方表述中披露的架構創新,包括令牌級注意力壓縮 DeepSeek Sparse Attention 以及用於長上下文運算的顯著效率提升。他指出,V4-Pro 相較於 V3.2,在 1M 上下文長度下展現了大幅更低的每令牌推論運算量與 KV 快取需求,並強調這些架構進展與訓練資料蒸餾無關,而且所有研究人員(包括美國的實驗室)都能從開源發展中受益。
展開
04:57

小米揭露 MiMo-V2-Pro 訓練細節:1T 模型參數,部署數千台 GPU

Gate 新聞訊息,4 月 24 日——小米大型語言模型團隊負責人 羅福立 在一場深入採訪中披露,MiMo-V2-Pro 模型總計擁有 1 兆(trillion)參數,訓練過程需要數千台 GPU。她指出,1T 規模代表達成性能接近 Claude Opus 4.6 等級所需的最低門檻,並取得下一階段 AI 代理的競爭性入場票。
展開