Anthropic 确认:Claude Code 质量下滑背后是三项产品层变更,而非模型问题

Gate News 消息,4月23日——Anthropic 的工程团队确认,用户在过去一个月中报告的 Claude Code 质量退化源于三个相互独立的产品层变更,而非 API 或底层模型问题。这三个问题分别在 4月7日、4月10日和 4月20日得到修复,当前最终版本为 v2.1.116。

第一项变更发生在 3月4日。为了解决在 Opus 4.6 高推理强度下偶发出现的极端延迟峰值,团队将 Claude Code 的默认推理工作量等级从 “high” 降为 “medium”。在大量用户抱怨性能下降后,团队在 4月7日撤回了该变更。目前在 Opus 4.7 上默认为 “xhigh”,在其他模型上默认为 “high”。

第二个问题是在 3月26日引入的一个漏洞。系统被设计为在对话不活跃超过一小时后清除旧的推理记录,以降低会话恢复成本。然而,实现中的缺陷导致清除操作在之后每一次轮次中反复执行,而不是只执行一次,从而使模型逐步丢失既有推理上下文。该问题表现为越来越健忘、重复操作以及异常的工具调用。该漏洞还导致每次请求都发生缓存未命中,从而加速用户配额的消耗。两个彼此无关的内部实验掩盖了复现条件,使得调试过程延长到超过一周。在 4月10日修复后,团队使用 Opus 4.7 检查了有问题的代码,并发现 Opus 4.7 能识别该漏洞,而 Opus 4.6 无法。

第三项变更于 4月16日与 Opus 4.7 同期上线。团队在系统提示词中加入了指令,以减少冗余输出。几周的内部测试表明不会出现回归,但上线后与其他提示词的交互会降低编码质量。更长时间的评估显示 Opus 4.6 和 4.7 的性能均下降 3%,因此团队在 4月20日执行了回滚。

这三项变更在不同时间影响了不同用户群体,它们叠加产生了广泛且不一致的质量下滑,使得诊断变得更加复杂。Anthropic 表示,现在它将需要更多内部员工像用户一样使用相同的公开构建版本,对每一次系统提示词修改都运行完整的模型评估套件,并实施分阶段的灰度发布期。作为补偿,Anthropic 已重置所有订阅用户的使用配额。

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

xAI Илона Маска переименуют в SpaceXAI, поскольку статус независимой компании прекращается

Согласно Odaily, Илон Маск объявил, что xAI будет переименована в SpaceXAI, поскольку компания больше не будет работать как независимое юрлицо.

GateNews26м назад

IBM расширяет набор корпоративных AI-инструментов с новыми агентными решениями на Think 2026

По данным IBM, компания объявила о расширении своих корпоративных возможностей ИИ на конференции Think 2026 в Бостоне, запуская новые агентные инструменты, чтобы помочь организациям внедрять искусственный интеллект в повседневные операции. Context Studio, теперь доступный в общем пользовании, позволяет предприятиям

GateNews34м назад

Акции Hut 8 выросли на 30% до аренды дата-центра для ИИ на $9,8 млрд

Акции Hut 8 подскочили более чем на 30% после новости о соглашении об аренде AI-ЦОД на 9,8 миллиарда долларов. Биткоин-майнер расширяется в AI-инфраструктуру благодаря долгосрочному контракту на уровне hyperscale, размещённому в Техасе. Расширение AI-инфраструктуры Контракт включает опции, которые могут увеличить общую

CryptoFrontier47м назад

Мечты Claude от Anthropic: агент сам упорядочивает память между задачами, устраняет дубликаты и противоречия

Anthropic на мероприятии Code with Claude объявила Dreams: чтобы Claude Managed Agents автоматически систематизировали воспоминания, устраняли дубликаты и противоречия между несколькими сессиями, а также обновляли устаревшие записи, выводя проверяемую сводную базу воспоминаний; входной лимит — 100 сессий и 4 096 символов, асинхронное выполнение, занимает от нескольких минут до нескольких десятков минут, поддерживает наблюдение в режиме стриминга. Исследовательский превью-тест нужно подать отдельно; пока что доступна только поддержка claude-opus-4-7 и claude-sonnet-4-6, дата официального релиза не определена.

ChainNewsAbmedia3ч назад

Anthropic заключает сделку с SpaceX по вычислительным мощностям: получает Colossus 1 целиком — 220 тыс. GPU, а для Claude снимают ограничения

Anthropic объявила о сотрудничестве по вычислительным мощностям с SpaceX для дата-центра Colossus 1: будет задействовано более 220 тыс. GPU Nvidia, мощность — свыше 300MW. Планируется, что в течение месяца вся инфраструктура будет полностью развернута для использования Anthropic, чтобы улучшить вычисления и впечатления для Claude и Code. Параллельно будет ослаблен лимит потребления для Pro/Max/Team/Enterprise каждые 5 часов, отменены лимиты на пиковые нагрузки и повышена скорость Opus API. Также одновременно расширяется базовая инфраструктура в Азии и Европе; в будущем есть намерения вроде «орбитальных AI-вычислений», но сделок пока не заключено.

ChainNewsAbmedia4ч назад
комментарий
0/400
Нет комментариев