Ramp Labs 提出多智能體記憶共享新方案,Token 消耗最高降低 65%

GateNews

閘道消息,4 月 11 日,AI 基礎設施公司 Ramp Labs 發布研究成果「Latent Briefing」,透過直接壓縮大模型 KV 快取,實現多智能體系統之間的高效記憶共享;在不損失準確率的前提下,大幅降低 Token 消耗。在主流多智能體架構中,編排者(Orchestrator)將任務拆解並反覆呼叫工作者(Worker)模型,隨著推理鏈路不斷延伸,Token 用量呈指數級膨脹。Latent Briefing 的核心思路是借助注意力機制識別上下文中真正關鍵的部分,於表示層直接丟棄冗餘資訊,而非依賴速度慢的 LLM 摘要或穩定性差的 RAG 檢索。在 LongBench v2 基準測試中,該方法表現亮眼:Worker 模型 Token 消耗降低 65%,中等長度文件(32k 至 100k)的 Token 節省中位數達 49%,整體準確率較基線提升約 3 個百分點;而每次壓縮的額外耗時僅約 1.7 秒,較原始演算法提速約 20 倍。實驗以 Claude Sonnet 4 作為編排者、Qwen3-14B 作為工作者模型,涵蓋學術論文、法律文書、小說及政府報告等多種文件情境。研究還發現,最佳壓縮閾值會因任務難度與文件長度而異——難題適合採取激進壓縮以過濾投機性推理雜訊,長文件則更適合輕度壓縮以保留分散的關鍵資訊。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Virtuals Protocol 推出 OpenGradient Titan 空投,今部分發 50 萬 OPG

根據 Virtuals Protocol 的官方公告,OpenGradient Titan Launch 空投已於 5 月 7 日正式上線。符合資格的用戶可直接從其 Virtuals 帳戶領取 OPG 代幣。今天將發放總計 500,000 OPG 代幣,以獎勵對 Virtuals 的貢獻者。

GateNews19分鐘前

NVIDIA 發表 Nemotron 3 Nano Omni 開源多模態

NVIDIA 公布 Nemotron 3 Nano Omni 開源多模態模型,將視覺、語音與語言整合於單一模型,作為 AI 代理的感知層。核心為 30B-A3B MoE、256K context、9x 吞吐,支援文字、影像、音訊、影片等輸入,輸出為文字。與 Nemotron 3 Super/Ultra 協同,適用電腦操作、文件智慧與音畫理解等場景,並公開權重與訓練資料,部署覆蓋本地、NIM 與第三方平台。

鏈新聞abmedia44分鐘前

NeoSoul 與 AllScale 今日宣布在代理信貸與穩定幣結算方面的策略合作

根據 ChainCatcher,AI Agent Economy 專案 NeoSoul 於今日(5 月 7 日)宣布與 AllScale 建立策略合作夥伴關係,藉此探索用於自主 Agent 協作的信用生成與穩定幣結算機制。該合作夥伴關係將聚焦於自動化 Agent 之間的付款流程——作為

GateNews1小時前

FIS 與 Anthropic 開發用於反洗錢的 AI 代理,並計畫在 2026 年下半年部署至 BMO 以及 Amalgamated Bank

FIS 和 Anthropic 正在開發用於自動化金融犯罪調查的 AI 代理程式,先從反洗錢作業開始。金融犯罪 AI 代理程式將從銀行系統提取資料,並將交易與已知手法進行比對評估,以協助調查人員審閱其相關內容

GateNews2小時前

Prime Intellect Lab 於 5 月 7 日推出一般可用(GA),並在測試版完成 10,000+ 次訓練執行

根據 Prime Intellect,該公司旗下的 Lab 平台於 2026 年 5 月 7 日退出測試版,並轉為一般可用,作為用於自我強化 AI 代理的端到端訓練環境。統一式管線整合了模型改進工作流程,使使用者能夠定義任務、設定並配置

GateNews3小時前

Cloudflare 在 Consensus 2026 上每天觸發 10 億筆 HTTP 402 回應,並與 Visa 與 Experian 推出「Agent Trust Framework」

根據 Foresight News,Cloudflare 首席安全官 Stephanie Cohen 於 2026 年的 Consensus 上宣布,該平台每天觸發約 10 億次 HTTP 402 回應,反映出 AI 代理對付費存取網頁內容的需求。該公司與 Visa 和 Experian 共同推出了 Agent Trust

GateNews5小時前
留言
0/400
暫無留言