Боїтеся відкрити магічну скриньку? Найпотужніша модель Anthropic у історії зовсім не наважується бути опублікованою

BlockBeatNews

В репозиторії коду OpenBSD виявили вразливість, заховану 27 років. У FFmpeg є вразливість, захована на 16 років; той фрагмент коду до того, як його знайшли, викликали понад 5 млн разів. Дістати ці дві речі — не будь-який топовий дослідник із платформи винагород за вразливості, і не Google Project Zero. Це модель Anthropic, яку ще не випустили назовні, з кодовою назвою Claude Mythos Preview.

7 квітня Anthropic оголосила Project Glasswing. Сам по собі крок дуже простий: надіслати Mythos Preview одному білому списку. До списку входять AWS, Apple, Google, Microsoft, NVIDIA, Broadcom, Cisco, CrowdStrike, JPMorgan Chase, Linux Foundation, Palo Alto Networks, а також приблизно 40 організацій, відповідальних за критичну інфраструктуру. За межами списку отримати модель неможливо. Anthropic чітко заявила, що в короткостроковій перспективі не планує публічний реліз цієї моделі.

Це перший раз, коли передова лабораторія активно вирішила замкнути на собі те, що в неї найсильніше.

За останні два роки ритм релізів майже як умовний рефлекс. Кожне покоління GPT, Gemini та Claude — це «реліз, спостереження, латання». Саме «policy» Anthropic щодо відповідального розширення (RSP) по суті є рамковою обіцянкою: досягнувши певного порогу можливостей — застосовуються відповідні рівні пом’якшувальних заходів, а потім продовжують випуск. Glasswing не є наступним кроком цього фреймворку — це його перший виняток. Модель, яку Anthropic уже сама оцінила як «не підходить для випуску за первісним процесом», виокремлюють і дають лише стороні оборони.

Що саме досягнув Mythos Preview. Офіційна версія звучить так: «тисячі нульових днів (zero-day), що охоплюють кожну популярну операційну систему й кожен популярний браузер». Те, що говорить більше за цифри, — це розмах здатності. У задачах на автономну розробку вразливостей успішність Claude 4.6 Opus майже нульова, тобто шість місяців тому найсильніша публічна модель Anthropic досі навіть не могла виконати цю роботу. Mythos здатен поєднувати кілька взаємно не пов’язаних вразливостей в один цілісний ланцюг атаки; чотириступеневе використання в браузері вже було доведеним прикладом. Від «майже нуля» до «ланцюга з чотирьох» — це не поступове покоління, а стрибок.

Здається, це вже відчули й з боку підтримувачів. Грег Кроа-Гартман з Linux kernel і автор curl Деніел Стенберґ останнім часом публічно говорили про одне й те саме: за останній рік безпекові звіти, згенеровані ШІ, перейшли від «рівня спаму» до «реальних, високоякісних і таких, які не можна ігнорувати». Кількість отриманих звітів у відкритих проєктів зростає, і зростає їхня якість, тоді як людських ресурсів у підтримувачів не додається. Це ті муки, які оборонний бік уже давно переживає. Дії Anthropic лише винесли цю проблему з туману тривоги на світло.

Є сенс глянути на сам білий список. Три найбільші хмари (AWS, Google, Microsoft), три компанії з «твердотільного» обладнання (Apple, NVIDIA, Broadcom), два вендори мережевого обладнання (Cisco, Palo Alto Networks), одна компанія з безпеки на рівні кінцевих точок (CrowdStrike), одна відкрита інфраструктура (Linux Foundation), одна банківська установа. У списку лише один банк — JPMorgan Chase.

Це не випадковий розподіл місць. Anthropic намалювала карту «якщо не втримати — то всім кінець». Переважна більшість коду працює в стеку цих компаній; переважна більшість грошей — на їхніх рахунках однієї й тієї ж установи. Логіка білого списку — не «хто найбільше потребує», а «хто впаде першим і найшвидше потягне за собою всіх». За межами списку Anthropic додатково виділила 4 млн доларів відкритим безпековим організаціям. Гроші — на людські ресурси, модель — на можливості; разом це зводиться до одного: забезпечити підтримувачам кілька місяців.

Слова Anthropic самі по собі ще пряміші за список. У заяві компанія написала: «З огляду на швидкість розвитку ШІ такі можливості не залишаться надовго в руках учасників, які присвячені безпечному розгортанню». Одразу далі: «Для захисту глобальної мережевої інфраструктури може знадобитися кілька років».

Подивіться на ці дві фрази разом. Anthropic вважає, що часові вікна, коли модель витече або буде відтворена, короткі, а часові вікна, коли оборона встигне закрити вразливості чисто й повністю, довгі. Уся цінність Glasswing саме між цими двома часовими різницями. Контрольований перший хід заради вікна для патчів на кілька місяців або до одного року.

Є ще один вимір — вашингтонський. Anthropic веде з урядом США постійний діалог щодо можливостей Mythos Preview; водночас у неї триває незавершена суперечка з Міністерством оборони США щодо сфери застосування військового ШІ. Одна компанія з одного боку відмовляється використовувати модель для певних військових сценаріїв, а з іншого — сама надсилає цю модель у Linux Foundation і до команд безпеки Apple. Ці дві речі не суперечать одна одній: це дві сторони одного й того ж рішення. Anthropic визначає «для чого можна використовувати цю модель», а не залишає право визначення користувачам.

Найнепередбачуваніше в Glasswing — не те, що вона зробила, а те, коли вона це зробила. Раніше компанії зі ШІ доводили свою спроможність через реліз. Тепер Anthropic обрала доказ через «не випускати». Передова лабораторія сама замикає найсильніший продукт і при цьому каже, що не через комерційні причини, не тому що узгодження (alignment) ще не завершили, не через вимоги регуляторів — а тому що вона сама порахувала: відкритий графік уже не встигає за графіком ремонту.

Наступні кілька місяців треба буде дивитися не на сам Mythos Preview, а на те, наскільки багато вразливостей, що виникли на ньому в ~50 організаціях з білого списку, встигнуть закрити. Ще далі треба буде дивитися, чи будуть інші передові лабораторії робити так само. Якщо так, то в індустрії з ритмом «відкрито, ітерація, відкрито» вперше з’явиться дія «замкнути й потім розбиратися». Якщо ні, то Anthropic буде тією, хто стоятиме біля дверей. У руках ключі, а на столі — годинник.

Натисніть, щоб дізнатися більше. Lǜdong BlockBeats набирає співробітників

Ласкаво просимо приєднатися до офіційної спільноти Lǜdong BlockBeats:

Група підписки в Telegram: https://t.me/theblockbeats

Група для обговорень у Telegram: https://t.me/BlockBeats_App

Офіційний акаунт у Twitter: https://twitter.com/BlockBeatsAsia

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів