Модель Anthropic Mythos Claude Mythos не доступна для широкой публики

Anthropic сегодня объявила план: Project Glasswing (проект «Стеклянное крыло»). Причина, по которой они запустили этот проект, заключается в том, что Anthropic обучила совершенно новую сверхмощную модель Claude Mythos Preview — это, по сути, та самая модель, о которой упоминалось в утечке исходного кода пару дней назад.

В число участников проекта входят Amazon AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks, а также сама Anthropic — всего 12 организаций, которые объединились для совместного старта.

Если говорить по-простому, так как эта модель слишком мощная, они решили использовать режим безопасного тестирования: ее предоставляют только одобренным организациям для внутреннего использования, и она не открыта для широкой публики. Насколько она мощная? Смотрите прямо на данные, возможности кода и рассуждений — она уделывает opus 4.6:

Код:

Рассуждения:

Поиск и использование компьютера

Opus в буквальном смысле означает «шедевр», Mythos — «миф». CEO Anthropic и целая группа партнёров уже вышли на поддержку этого плана.

Anthropic прямо заявила, что не намерена открывать Claude Mythos Preview для широкой публики. Но долгосрочная цель — сделать так, чтобы пользователи могли безопасно использовать модели сопоставимого уровня возможностей. Для этого они планируют сначала разработать и проверить механизмы соответствующих защитных мер на уже готовящейся к выпуску модели Claude Opus, а затем, при контролируемых рисках, завершить итерации и постепенно продвигать процесс дальше; возможно, в скором времени выйдет новая версия opus, которая предоставит соответствующие возможности.

Давайте подробно разберём, что именно представляет собой Project Glasswing


Что эта модель обнаружила?

За последние несколько недель Anthropic с помощью Claude Mythos Preview просканировала распространённые в мире операционные системы, браузеры и другие важные программы.

Итог: были обнаружены несколько тысяч ранее не выявлявшихся zero-day уязвимостей, причём многие из них были оценены как относящиеся к высокому уровню риска.

Несколько конкретных примеров:

В OpenBSD — уязвимость, которая существует 27 лет. OpenBSD известна своей безопасностью и применяется для запуска межсетевых экранов и другой критически важной инфраструктуры. Эта уязвимость позволяет злоумышленнику, просто подключившись к целевой машине, добиться её удалённого падения.

В FFmpeg — уязвимость, которая существует 16 лет. FFmpeg используется бесчисленными программами для кодирования и декодирования видео. Модель нашла строку кода с уязвимостью; ранее эту часть уже сканировали автоматизированные инструменты тестирования — 5 000 000 раз — но так и не смогли обнаружить проблему.

В Linux-ядре модель самостоятельно обнаружила и «сцепила» несколько уязвимостей, позволяя атакующему повысить привилегии с уровня обычного пользователя до полного контроля над всей машиной.

Все эти уязвимости уже были сообщены соответствующим разработчикам ПО, и сейчас они полностью исправлены. Что касается остальных уязвимостей, Anthropic заранее опубликовала зашифрованные хэш-значения; после завершения исправлений они раскроют конкретные детали.


Зачем нужно было делать это?

По мнению Anthropic, способность AI находить и использовать уязвимости в программном обеспечении уже превзошла всех, кроме нескольких ведущих человеческих экспертов.

Распространение этих возможностей — вопрос времени, а не вопрос того, произойдёт ли это.

Ежегодные экономические потери от глобальной киберпреступности оцениваются примерно в 500 миллиардов долларов. Атаки на медицинские системы, энергетическую инфраструктуру и государственные органы уже нанесли реальный ущерб, а также создают постоянную угрозу гражданской и военной инфраструктуре.

AI существенно снижает стоимость, порог входа и требуемый уровень профессионализма для запуска таких атак.

Логика Anthropic такова: вместо того чтобы ждать, пока кто-то другой сначала использует эти возможности для атаки, лучше заранее применить их для защиты.


Как именно планируется это реализовать?

Project Glasswing на текущий момент включает два уровня.

Первый уровень — это 12 организаций-партнёров-основателей: они получат доступ к Claude Mythos Preview для сканирования и исправления уязвимостей в собственных ключевых системах; приоритетными направлениями являются обнаружение локальных уязвимостей, тестирование двоичных компонентов в режиме «чёрного ящика», безопасность конечных точек, пентесты и т. п.

Второй уровень — это ещё более 40 организаций, которые создают или поддерживают критически важную инфраструктуру ПО. Они также получат доступ к модели для сканирования собственных и open source систем.

Anthropic обязуется предоставить максимальный лимит использования моделей до 1 $00 млн. После окончания исследовательского превью Claude Mythos Preview предоставит участникам коммерческий доступ; цена — 25/125 долларов США за миллион токенов ввода/вывода; доступ будет поддерживаться через Claude API, Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry.

Кроме того, Anthropic через Linux Foundation пожертвует 2,5 миллиона долларов Alpha-Omega и 1,5 миллиона долларов OpenSSF, в сумме 4 миллиона долларов — для поддержки тех, кто занимается обслуживанием open source, в ответ на эту новую ситуацию. Обслуживающие open source проекты смогут подать заявку на доступ через проект Claude for Open Source.

Планы на следующий этап

В части обмена информацией партнёры будут по возможности максимально обмениваться информацией и передовыми практиками. Anthropic обязуется в течение 90 дней опубликовать отчёт о ходе исследовательской работы, включая количество найденных уязвимостей, вопросы, которые уже удалось исправить, а также улучшения, которые можно будет раскрыть.

В части рекомендаций по политике (policy) Anthropic будет сотрудничать с ключевыми организациями по безопасности, чтобы сформировать практические рекомендации по следующим направлениям: процесс раскрытия уязвимостей, процесс обновления ПО, безопасность open source и цепочки поставок, жизненный цикл безопасной разработки ПО, стандарты для регулируемых отраслей, масштабирование и автоматизация классификации уязвимостей, автоматизация выпуска патчей.

Подробная информация — в официальном первоисточнике: https://www.anthropic.com/glasswing

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить