Gate News 消息,3月25日,谷歌研究院發布量化壓縮算法TurboQuant,可將大語言模型的KV快取壓縮至3 bit,記憶體佔用縮減至少6倍,無需訓練或微調,亦不影響模型精度。在4 bit模式下,在英偉達H100 GPU上計算注意力的速度較32 bit未量化基線提升最高8倍。研究團隊在LongBench、Needle In A Haystack、ZeroSCROLLS等長上下文基準上,使用Gemma和Mistral模型進行驗證,TurboQuant在所有測試中均達到最佳表現。該算法由兩個子算法組成:PolarQuant通過極座標變換消除傳統量化方法的記憶體開銷,QJL僅用1 bit校正殘餘誤差。該研究由谷歌研究院的Amir Zandieh和副總裁兼Google Fellow Vahab Mirrokni主導,與韓國KAIST和紐約大學合作完成,將於ICLR 2026發表。谷歌表示該技術的主要應用之一是解決Gemini等模型的KV快取瓶頸。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
野村調查:80%的機構投資人願意配置2-5%於加密貨幣
野村(Nomura)的調查顯示,80%的機構投資人目標是將資金中的2-5%投資於加密貨幣,並偏好像質押(staking)與借貸(lending)這類收益策略。法規清晰度與風險管理是提升機構對數位資產興趣的關鍵。
GateNews7小時前
穩定幣市場觸及 $322B ATH,2026 年第一季交易量達 $8.3 Trillion
穩定幣市場出現顯著成長,在整體加密市場收縮的情況下,資金規模飆升 $2.25 billion 以達到 $322 billion。儘管更廣泛的加密市場下滑,USDC 的供給仍大幅增加,而 USDT 則維持其市佔率。收益型穩定幣為這一成長作出了顯著貢獻,交易活動達到歷史新高。
GateNews7小時前
以太坊基金會公布 ETH Rangers 專案成果:已回收或凍結超過 5.8M 美元資產
以太坊基金會的 ETH Rangers 專案已成功完成,資助 17 名研究人員以強化生態系的公共安全。成果包括回收 5.8M 美元資產、識別超過 785 個漏洞,並開發多款安全工具。
GateNews11小時前
2025 年市場下行期間,加密風投頂尖機構的管理資產(AUM)出現顯著下滑
在 2025 年加密貨幣市場下行期間,主要風險投資機構的管理資產(AUM)出現顯著下滑,但 Haun Ventures 成長了 30%。Paradigm 與 a16z 正在為新基金募集超過 42 億美元,凸顯出不同機構之間的表現差異。
GateNews15小時前
BitMine 季度淨虧損 38.1 億美元,ETH 未實現虧損佔比達 99%
BitMine Immersion Technologies於2026年4月15日向SEC提交財報,顯示截至2月28日的季度淨虧損達38.1億美元,主要來源於以太坊持倉的未實現損失。公司持有約487萬枚ETH,其平均購入成本為每枚3,794美元,最近市值超過107億美元。BMNR股票已升級至紐約證券交易所,當前報價21.69美元。
Market Whisper19小時前