Anthropic Виявляє Три Зміни На Рівні Продукту, Що Стоять За Падінням Якості Claude Code, А Не Проблему Моделі

Повідомлення Gate News, 23 квітня — інженерна команда Anthropic підтвердила, що погіршення якості Claude Code, про яке повідомляли користувачі протягом минулого місяця, було спричинене трьома незалежними змінами на рівні продукту, а не проблемами API чи базової моделі. Три проблеми були виправлені відповідно 7 квітня, 10 квітня та 20 квітня, а нинішня фінальна версія має v2.1.116.

Перша зміна сталася 4 березня, коли команда зменшила рівень зусиль за замовчуванням для міркувань Claude Code з “high” до “medium”, щоб усунути епізодичні надмірні піки затримок у Opus 4.6 за високої інтенсивності міркувань. Після численних скарг користувачів на зниження продуктивності команда повернула цю зміну 7 квітня. Нині поточне значення за замовчуванням — “xhigh” для Opus 4.7 і “high” для інших моделей.

Друга проблема була багом, внесеним 26 березня. Система була спроєктована очищати старі записи міркувань після того, як бездіяльність у розмові перевищувала одну годину, щоб зменшити витрати на відновлення сесії. Однак недолік у реалізації спричинив те, що очищення виконувалося повторно на кожному наступному ході, а не один раз, через що модель поступово втрачала попередній контекст міркувань. Це проявлялося як зростаюча забудькуватість, повторювані операції та ненормальні виклики інструментів. Баг також спричинив збіги кешу на кожен запит, пришвидшуючи витрачання квот користувачів. Два не пов’язані з цим внутрішні експерименти приховали умови відтворення, розтягнувши процес дебагу більш ніж на тиждень. Після виправлення 10 квітня команда переглянула проблемний код, використовуючи Opus 4.7, і виявила, що Opus 4.7 може ідентифікувати цей баг, тоді як Opus 4.6 — ні.

Третя зміна була запущена 16 квітня разом із Opus 4.7. Команда додала інструкції до системного промпту, щоб зменшити надмірний повторюваний вивід. Внутрішнє тестування протягом кількох тижнів показало відсутність регресії, але після запуску взаємодія з іншими промптами погіршила якість кодування. Розширене оцінювання виявило 3% падіння продуктивності в обох випадках — Opus 4.6 і 4.7 — що призвело до відкату 20 квітня.

Ці три зміни вплинули на різні групи користувачів у різний час, а їхня сукупна дія спричинила поширене та непослідовне падіння якості, ускладнивши діагностику. У Anthropic заявили, що тепер для використання того самого публічного номера версії збірки, що й у користувачів, знадобиться задіяти більше внутрішніх співробітників, виконувати повні комплекти оцінювання моделей для кожної модифікації системного промпту та впроваджувати етапні періоди розгортання. Як компенсацію, Anthropic скинув квоти використання для всіх передплатників.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

OpenAI запускає протокол MRC мережі разом із AMD, Intel, NVIDIA; підтримує 100 000+ GPU

Згідно з оголошенням OpenAI від 6 травня, компанія співпрацює з AMD, Broadcom, Intel, Microsoft і NVIDIA, щоб запустити Multipath Reliable Connection (MRC) — відкритий мережевий протокол для взаємодії GPU у великих кластерах тренування ШІ. Протокол розділяє одну передачу даних на

GateNews15хв. тому

Акції Hut 8 зростають на 30% у торгах напередодні ринку після підписання угоди про оренду дата-центру з даними для ШІ на $9,8 млрд

За даними The Block, акції Hut 8 Corp. зросли більш ніж на 30% у торгах на передринку після того, як компанія підписала угоду про оренду на 9,8 мільярда доларів для кампусу дата-центрів під штучний інтелект у окрузі Нуесес, штат Техас, створеного для обчислювальної архітектури NVIDIA. Неназваний орендар буде використовувати

GateNews34хв. тому

CTO CleanSpark: AI/HPC-інфраструктурі потрібно більше мережевих ресурсів, ніж майнінгу Bitcoin

Згідно з інтерв’ю CoinDesk, технічний директор CleanSpark Тейлор Моннінг заявив, що перехід від майнінгу Bitcoin до інфраструктури AI/HPC потребує більшої надмірності та меншої імпровізації. «Мережеве волокно одного стійкового сервера перевищує таке в усьому майнінг-центрі Bitcoin», Моннінг

GateNews39хв. тому

Публічна компанія придбала AI-інвестиційну платформу та казначейський застосунок

За даними Foresight News, інвестиційний застосунок Public оголосив про придбання AI-орієнтованої інвестиційної платформи Treasury App 6 травня. Суму угоди не розголошено. Угода має на меті посилити брокерські операції Public, що працюють на основі ШІ, які наразі підтримують акції, облігації та

GateNews1год тому

MiroMind зупиняє сервіс MiroThinker у Великому Китаї, починаючи з 12 травня

За даними BlockBeats, MiroMind — компанії з досліджень у сфері ШІ, заснованої Чен Тяньцяо, співзасновником Shanda Group, — призупинить свій сервіс MiroThinker (веб- і мобільні версії) на материковому Китаї, у Гонконзі та Макао починаючи з 12 травня 2026 року. Дату призупинення та графік відновлення було оголошено через

GateNews1год тому

ChatGPT виходить у Excel і Google Sheets: GPT-5,5 напряму входить у таблиці, Copilot і Gemini влаштовують тристороннє змагання

OpenAI випустила додатки ChatGPT для Excel і ChatGPT для Google Sheets, використовуючи рушій GPT-5,5; головна ідея — «роби й одразу пояснюй». Функції охоплюють аналіз, автоматичне написання формул, оновлення таблиць і покрокове пояснення процесу міркування, щоб користувачі могли напряму обробляти й розуміти дані в межах електронних таблиць. Це початок тристоронньої конкуренції з Copilot і Gemini та сигнал про новий ландшафт корпоративної продуктивності завдяки AI; користувачам у Тайвані потрібно встановити застосунки через AppSource / Workspace Marketplace, а також звернути увагу на конфіденційність даних і на те, чи потрібен ChatGPT Plus.

ChainNewsAbmedia2год тому
Прокоментувати
0/400
Немає коментарів