"CLOUD"的搜索结果

DeepSeek V4-Flash 登上 Ollama Cloud、美國主機:Claude Code、OpenClaw 一鍵串接

Ollama Cloud 已上架 DeepSeek V4-Flash,推理在美国主机,提供三组一键指令接入 Claude Code、OpenClaw、Hermes。V4-Flash/V4-Pro 采用 MoE 架构、原生支持 1M 上下文,并以 Token-wise 压缩+DSA 稀疏注意力降低成本,1M 情境下单 token FLOPs 降低 27%、KV 缓存降低 10%。API 相容 OpenAI ChatCompletions 与 Anthropic,便于多工作流切换,降低成本与数据主权风险。
鏈新聞abmedia·04-24 10:45

腾讯开源 Hy3 预览版,代码基准测试较前代提升 40%

腾讯于 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式开源 Hy3 预览版大型语言模型,并同步于腾讯云端(Tencent Cloud)提供付费 API 服务。据 Decrypt 于 4 月 24 日报道,Hy3 预览版自 1 月下旬启动训练,截至发布时间历时不足三个月。
Market Whisper·04-24 05:14
news-image

Google Cloud Next 2026:推出 Gemini 企业代理平台,7.5 亿美元助顾问落地

Google Cloud 在 Cloud Next 2026 公布 Gemini 企业代理平台,整合模型选择、代理构建、DevOps、编排与企业安全管控,并推出 7.5 亿美元基金以协助 McKinsey、Accenture、Deloitte 部署企业代理。平台搭配 Ironwood TPU、A2A 与 MCP,打造自家全栈与顾问通路,对抗 OpenAI Operator 与 Anthropic Claude 企业版。
鏈新聞abmedia·04-23 02:54

Google Ironwood TPU:10 倍性能 + 四家合作夥伴对抗 Nvidia

根据 Bloomberg 深度报道与 Google 官方公告,Google 于 4 月 22 日正式扩张自研 AI 晶片阵容:推理专用 Ironwood(第七代 TPU)在 Google Cloud 全面供货,并同步启动与 Broadcom、MediaTek、Marvell、Intel 四家伙伴的下一代设计合作,目标是以定制晶片供应链正面挑战 Nvidia 在 AI 算力市场的主导地位。 Ironwood:第七代 TPU,首次专为推理设计 Ironwood 是 Google TPU 系列第七代产品,也是首款在“训练推理分流”策略下的推理专用晶片。Google 揭露的规格:单晶片峰值效能为 T
鏈新聞abmedia·04-22 13:15

Google 推出 Deep Research Max:支持 MCP,可连接企业私有数据

根据 Google DeepMind 官方博客公告,Google 将于 2026 年 4 月 21 日推出新一代自主研究代理 Deep Research 和 Deep Research Max,构建于 Gemini 3.1 Pro 之上,作为 2025 年 12 月通过 Interactions API 提供的预览版之后的正式版本。两款代理目前以公开预览形式在 Gemini API 的付费方案中开放,Google Cloud 的初创与企业用户将陆续接入。 两款变体定位不同:交互式 vs 异步深度 Google 将两款代理按使用情境区分:Deep Research
鏈新聞abmedia·04-21 18:14