Anthropic identifiziert drei Änderungen auf Produktebene hinter dem Qualitätsrückgang von Claude Code, nicht ein Modellproblem

Gate News-Meldung, 23. April — Das Engineering-Team von Anthropic bestätigte, dass die von Nutzern über den vergangenen Monat gemeldete Qualitätsverschlechterung von Claude Code auf drei unabhängige Änderungen auf Produktebene zurückzuführen ist, nicht auf Probleme mit der API oder dem zugrunde liegenden Modell. Die drei Probleme wurden jeweils am 7. April, am 10. April und am 20. April behoben, wobei die finale Version jetzt v2.1.116 ist.

Die erste Änderung erfolgte am 4. März, als das Team die standardmäßige Stufe des Rechenaufwands für Claude Code von „high“ auf „medium“ reduzierte, um gelegentliche extreme Latenzspitzen in Opus 4.6 bei hoher Rechenintensität zu adressieren. Nach weitreichender Kritik von Nutzern an der verminderten Leistung setzte das Team die Änderung am 7. April zurück. Der aktuelle Standard ist nun „xhigh“ für Opus 4.7 und „high“ für andere Modelle.

Das zweite Problem war ein Bug, der am 26. März eingeführt wurde. Das System war so ausgelegt, alte Aufzeichnungen zum Rechenaufwand nach Konversationsinaktivität zu bereinigen, die eine Stunde überschritt, um die Kosten für die Sitzungswiederherstellung zu reduzieren. Ein Fehler in der Implementierung führte jedoch dazu, dass das Bereinigen bei jeder nachfolgenden Antwort wiederholt ausgeführt wurde, statt nur einmal, wodurch das Modell schrittweise den vorherigen Kontext zum Rechenaufwand verlor. Dies zeigte sich als zunehmende Vergesslichkeit, wiederholte Operationen und abnorme Tool-Aufrufe. Der Bug führte außerdem zu Cache-Misses bei jeder Anfrage, wodurch der Verbrauch von Nutzerkontingenten beschleunigt wurde. Zwei unbeteiligte interne Experimente verdeckten die Bedingungen für die Reproduktion und verlängerten den Debugging-Prozess auf über eine Woche. Nachdem der Bug am 10. April behoben worden war, überprüfte das Team problematischen Code mit Opus 4.7 und stellte fest, dass Opus 4.7 den Bug erkennen konnte, Opus 4.6 jedoch nicht.

Die dritte Änderung wurde am 16. April zusammen mit Opus 4.7 eingeführt. Das Team ergänzte Anweisungen in den System-Prompt, um redundante Ausgaben zu reduzieren. Interne Tests über mehrere Wochen zeigten keine Regression, aber nach dem Launch verschlechterte die Interaktion mit anderen Prompts die Codequalität. Eine erweiterte Evaluierung ergab einen 3%-Leistungsabfall in sowohl Opus 4.6 als auch 4.7, was zu einem Rollback am 20. April führte.

Diese drei Änderungen betrafen unterschiedliche Nutzergruppen zu unterschiedlichen Zeiten, und ihre kombinierte Wirkung führte zu einem weitverbreiteten und uneinheitlichen Qualitätsrückgang, was die Diagnose erschwerte. Anthropic erklärte, dass man nun mehr interne Mitarbeitende benötigen werde, um wie Nutzer dieselbe öffentliche Build-Version zu verwenden, vollständige Model-Evaluations-Suites für jede Änderung am System-Prompt auszuführen und gestufte Rollout-Zeiträume zu implementieren. Als Ausgleich hat Anthropic die Nutzungskontingente für alle Abonnenten zurückgesetzt.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Visa startet am 1. Mai in Hongkong das „Agentic Ready“-Programm und ermöglicht Zahlungen mit KI-Agenten

Laut der Hongkonger Medien Ming Pao hat Visa am 1. Mai in Hongkong das Programm „Visa Agentic Ready“ gestartet, das Zahlungen per KI-Agenten ermöglicht. Das Programm nutzt Tokenisierung, Identitätsverifizierung, Risikomanagement und Autorisierungsmechanismen. Zu den ersten Teilnehmern gehören

GateNews8M her

Der KI-Capex der globalen Hyperscale-Cloud-Unternehmen wird voraussichtlich 2027 1 Billion US-Dollar erreichen, ein Plus von 25% im Jahresvergleich: BofA

Laut Bank of America Securities wird erwartet, dass die Investitionen (Capex) der globalen Hyperscale-Cloud-Computing-Unternehmen 2026 800 Milliarden US-Dollar übersteigen und damit einem Anstieg von 67% im Jahresvergleich entsprechen. Die Analysten der Bank prognostizieren außerdem, dass die Capex 2027 die 1 Billion US-Dollar überschreiten wird, mit einer geschätzten 25% y

GateNews26M her

PayPal kündigt eine Umstrukturierung in drei Einheiten an und peilt bis Ende 2027 $900M jährliche Einsparungen an

Am 30. April kündigte PayPal eine umfassende strukturelle Umorganisation in drei eigenständige Geschäftsbereiche an – Consumer, Small Business und Enterprise – die darauf abzielt, die Abläufe zu straffen und die Integration von Künstlicher Intelligenz zu beschleunigen. Das Unternehmen schätzt, dass die Umstrukturierung liefern wird

GateNews1Std her

Kaiser Network schließt $4 Millionen US-Dollar an Finanzmitteln für die dezentrale KI-Computing-Layer-1 ab

Laut ChainCatcher hat Kaisar Network, ein dezentralen KI-Computing-Layer-1-Netzwerk, bis heute $4 Millionen US-Dollar an Finanzierungen abgeschlossen, darunter 1 Million US-Dollar in einer strategischen Pre-Seed-Runde. Zu den Investoren gehören Merov Capital, StoneBlock, WM Capital, Arche Fund, Q42 und Unicorn Ventures. Das Netzwerk

GateNews3Std her

Der CFO von OpenAI weist Gerüchte über Umsatz-Ziele zurück und sagt, das Unternehmen arbeite am 1. Mai auf dem höchsten Niveau

Laut Bloomberg wies die Chief Financial Officer von OpenAI, Sarah Friar, am 1. Mai Gerüchte zurück, wonach das Unternehmen interne Verkaufs- und Nutzerziele verfehlt habe. Friar erklärte, die Firma setze ihre Pläne auf höchstem Niveau um, und beschrieb die Nachfrage nach Produkten als „vertikale Mauer“. Sie merkte an, dass die Umsetzung

GateNews4Std her
Kommentieren
0/400
Keine Kommentare