Anthropic совместно с 12 крупными компаниями запустили проект «Стеклянное крыло», используя нераскрытую самую мощную модель Mythos для устранения глобальных программных уязвимостей

作者: Anthropic

Перевод: 深潮 TechFlow

深潮導读: Anthropic опубликовала передовую модель Claude Mythos Preview, которая пока не была представлена публично; ее возможности по аудиту кода уже превосходят подавляющее большинство специалистов по безопасности среди людей — она способна самостоятельно выявлять нулевые дни, существующие десятилетиями.

На основе этих возможностей Anthropic совместно с 12 технологическими гигантами, включая AWS, Apple, Google, Microsoft, Nvidia и др., инициировала план Project Glasswing. Было выделено кредитное плечо в размере 100 млн долларов США; цель — сначала закрыть уязвимости в ключевом глобальном ПО, пока злоумышленники не получат сопоставимые возможности.

Введение

Сегодня мы объявляем Project Glasswing («план «Glasswing»») — новое инициативное направление, объединяющее Amazon Web Services (AWS), Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, J.P. Morgan, Linux Foundation, Microsoft, Nvidia и Palo Alto Networks. Цель — защитить безопасность ПО, которое является критически важным для всего мира.

Мы запустили Project Glasswing, потому что новая передовая модель, обученная Anthropic, продемонстрировала способности, которые, как мы считаем, могут изменить ландшафт кибербезопасности. Claude Mythos Preview — это универсальная передовая модель, которая пока не выпущена; она раскрывает суровый факт: кодирующие возможности AI уже достигли такого уровня, при котором — при обнаружении и эксплуатации уязвимостей ПО — они могут превзойти всех, кроме самых топовых экспертов.

Mythos Preview уже обнаружила тысячи высокорисковых уязвимостей, охватывающих каждую из основных операционных систем и каждый из основных браузеров. С учетом темпов прогресса в AI такая способность в ближайшем будущем будет распространяться, и может оказаться в руках безответственных пользователей. Последствия для экономики, общественной безопасности и национальной безопасности могут быть очень серьезными. Project Glasswing — это срочная попытка, чтобы в первую очередь направить эти возможности на оборону.

В рамках Project Glasswing вышеупомянутые партнеры будут использовать Mythos Preview в своей оборонительной работе по безопасности; Anthropic поделится извлеченными уроками, чтобы принести пользу всей отрасли. Мы также открыли доступ еще более чем 40 организациям, которые строят или поддерживают критически важную инфраструктуру ПО, чтобы они могли сканировать и укреплять свои собственные и open-source системы. Anthropic обязуется выделить на это до 100 млн долларов США лимита на использование Mythos Preview, а также 4 млн долларов США в виде прямого пожертвования организациям, занимающимся безопасностью с открытым исходным кодом.

Project Glasswing — это лишь отправная точка. Ни одна организация не может решить проблему кибербезопасности в одиночку: у передовых разработчиков AI, у других компаний-разработчиков ПО, у специалистов по исследованию безопасности, у поддерживающих open-source, а также у правительств всех стран есть незаменимые роли. Защита глобальной киберинфраструктуры может занять годы; в то время как передовые AI-возможности в ближайшие месяцы могут совершить заметный скачок. Чтобы киберзащитники сохранили преимущество, действовать нужно уже сейчас.

Кибербезопасность в эпоху AI

ПО, от которого мы зависим каждый день — системы банкинга, хранение медицинских записей, подключение логистических сетей, поддержание работы энергосети — всегда имело баги. Большинство из них несущественны, но некоторые представляют собой серьезные уязвимости безопасности: как только их обнаруживают, злоумышленники могут захватывать системы, парализовать работу или похищать данные.

Разрушительные последствия кибератак для корпоративных сетей, медицинских систем, энергетической инфраструктуры, транспортных узлов и государственных учреждений уже очевидны. На глобальном уровне государственные атаки со стороны Китая, Ирана, Северной Кореи и России уже угрожают инфраструктуре, которая поддерживает и мирную жизнь, и военную готовность. Даже небольшие атаки на отдельную больницу или школу могут привести к огромным экономическим потерям, раскрыть чувствительные данные и даже поставить жизни под угрозу. Годовой экономический ущерб от глобальной киберпреступности трудно оценить точно, но он может составлять около 500 млрд долларов США.

Раньше многие дефекты ПО годами оставались не обнаруженными, потому что для их нахождения и эксплуатации требовались лишь немногие специалисты по безопасности, обладающие соответствующими профессиональными знаниями. Но с появлением новейших передовых AI-моделей стоимость, усилия и профессиональный порог, необходимые для обнаружения и эксплуатации уязвимостей ПО, заметно снизились. За последний год AI-модели становились все сильнее в чтении кода и рассуждениях — особенно впечатляющими были результаты в выявлении уязвимостей и построении способов эксплуатации. Claude Mythos Preview обеспечила прорыв в этих навыках кибербезопасности: некоторые уязвимости, которые она обнаруживала, оставались «живыми» даже после десятилетий человеческого ревью, после миллионов автоматизированных тестов безопасности — а разработанный ею код для эксплуатации становился все более изящным.

Через десять лет после первого конкурса DARPA Cyber Grand Challenge передовые AI-модели приближаются или даже догоняют возможности самых топовых людей в обнаружении и эксплуатации уязвимостей. Если не принять необходимые меры безопасности, эти мощные сетевые возможности могут быть использованы для эксплуатации огромного числа существующих дефектов в самых важных в мире программных продуктах. Кибератаки станут более частыми и более разрушительными и дадут противникам США и их союзников больше силы. Это вопрос приоритета безопасности, на который должны обратить внимание демократические страны.

Хорошая новость: те же возможности, которые делают AI-модели опасными в неправильных руках, крайне ценны и для обнаружения и устранения критически важных дефектов ПО — они также помогают создавать новое ПО с меньшим числом безопасностных багов. Project Glasswing — важный шаг, который позволит защитникам создать устойчивое преимущество в грядущей эпохе AI-управляемой кибербезопасности.

Возможности Claude Mythos Preview по обнаружению уязвимостей и способов эксплуатации

За последние несколько недель мы с помощью Claude Mythos Preview обнаружили тысячи нулевых уязвимостей (дефектов, о которых ранее разработчики ПО вообще не знали) в каждом из основных операционных систем, в каждом из основных браузеров и в ряде других важных программных продуктов; многие из них относятся к категории критически опасных.

В блоге Frontier Red Team мы раскрыли технические детали части уязвимостей, которые уже были устранены, а также способы эксплуатации, найденные Mythos Preview. Почти все обнаружения (а также разработка многих связанных способов эксплуатации) были выполнены моделью полностью автономно — без какой-либо человеческой направляющей. Ниже три примера:

Mythos Preview обнаружила уязвимость в OpenBSD, которая существовала 27 лет. OpenBSD известна крайне высоким уровнем усиления безопасности и широко используется для фаерволов и другой критически важной инфраструктуры. Эта уязвимость позволяет злоумышленнику удаленно приводить целевую машину к краху только за счет подключения к ней.

Она также обнаружила уязвимость, существующую 16 лет, в FFmpeg. FFmpeg используется бесчисленными программами для видеокодирования/декодирования. Проблема была в одной строке кода, и хотя автоматизированные инструменты тестирования попадали в эту строку 5 млн раз, они никогда не обнаруживали проблему.

Модель автономно обнаружила и связала несколько уязвимостей в Linux-ядре (Linux-ядро запускает большую часть серверов по всему миру), реализовав атаку по повышению привилегий — от обычных пользовательских прав до полного контроля над машиной.

Все перечисленные выше уязвимости мы уже сообщили соответствующим разработчикам/поддерживателям ПО, и все они исправлены. Для многих других уязвимостей сегодня мы предоставляем детали в виде зашифрованных хэшей (см. блог Red Team) — с публикацией конкретной информации после завершения исправлений.

Бенчмарки оценки, включая CyberGym, также подтверждают заметный разрыв между Mythos Preview и нашей следующей по силе моделью Claude Opus 4.6:

Воспроизведение уязвимостей кибербезопасности - CyberGym

Помимо нашей собственной работы, многие партнеры также использовали Claude Mythos Preview в течение нескольких недель. Ниже — их отзывы:

«AI-возможности уже перешли через порог и фундаментально изменили уровень срочности, необходимый для защиты критически важной инфраструктуры от киберугроз — и это необратимо. Наши эксперименты с базовыми работами этих моделей показывают, что можно выявлять и устранять уязвимости в аппаратном и программном обеспечении с беспрецедентными скоростью и масштабом. Это глубокий сдвиг и четкий сигнал: старые подходы к усилению (hardening) систем больше не достаточны. Поставщики технологий должны немедленно и активно внедрять новые методы, а клиенты должны быть готовы к развертыванию. Именно поэтому Cisco присоединилась к Project Glasswing — работа слишком важная и слишком срочная, чтобы делать ее в одиночку».

—— Anthony Grieco, старший вице-президент Cisco и главный специалист по безопасности и доверию

«В AWS мы строим защиту до появления угроз — от специализированных чипов до всего технологического стека. Безопасность — это не что-то, относящееся к одной стадии; она непрерывна и встроена во всё, что мы делаем. Наша команда анализирует более 4 млн триллионов сетевого трафика каждый день, чтобы выявлять угрозы; AI — ключевой элемент наших возможностей масштабной обороны. Мы уже тестировали Claude Mythos Preview в собственной службе безопасности, применяя его к критически важным кодовым базам; он помогает нам укреплять код. Мы встраиваем глубокий опыт в сфере безопасности в наше сотрудничество с Anthropic и помогаем усиливать Claude Mythos Preview, чтобы больше организаций могли продвигать работу наивысшим стандартом безопасности».

—— Amy Herzog, вице-президент AWS и главный информационный специалист по безопасности

«Когда кибербезопасность больше не ограничена исключительно «человеческими» возможностями, открывается беспрецедентная возможность ответственно использовать AI для масштабного повышения безопасности и снижения рисков. Присоединившись к Project Glasswing и получив доступ к Claude Mythos Preview, мы можем раньше выявлять и смягчать риски, усиливая наши решения по безопасности и разработке, чтобы лучше защищать клиентов и Microsoft. При тестировании нашей open-source бенчмарочной базы безопасности CTI-REALM Claude Mythos Preview показал существенные улучшения по сравнению с предыдущими моделями. Мы с нетерпением ждем сотрудничества с Anthropic и более широкой отраслью, чтобы улучшить результаты безопасности для всех».

—— Igor Tsyganskiy, вице-президент по кибербезопасности в Microsoft и исполнительный вице-президент Microsoft Research

«Окно от обнаружения уязвимости до ее использования злоумышленником разрушилось — то, на что раньше уходили месяцы, теперь можно сделать за несколько минут с помощью AI. Claude Mythos Preview демонстрирует возможность для защитников действовать в масштабе, тогда как противники неизбежно будут стремиться использовать те же возможности. Это не причина замедляться — это причина ускоряться вместе. Чтобы развернуть AI, нужны гарантии безопасности. Именно поэтому CrowdStrike подключилась с первого дня».

—— Elia Zaitsev, технический директор CrowdStrike

«Раньше экспертиза в области безопасности была роскошью, которую могли себе позволить только организации с огромными командами безопасности. Поддерживающие open-source-проекты — чье ПО поддерживает большую часть критически важной инфраструктуры во всем мире — исторически могли решать проблемы безопасности только своими силами. Open-source ПО составляет подавляющую часть кода в современных системах, включая сами системы, которые AI-агенты используют для написания нового ПО. Предоставляя поддерживающим ключевые open-source репозитории доступ к новому поколению AI-моделей — способных массово и проактивно выявлять и исправлять уязвимости — Project Glasswing дает практичный путь для изменения этой ситуации. Так выглядит то, как усиленная AI безопасность переходит от эксклюзивного инструмента больших команд к надежному помощнику для каждого мейнтейнера».

—— Jim Zemlin, CEO Linux Foundation

«Кибербезопасность и устойчивость финансовой системы лежат в основе миссии J.P. Morgan, и мы верим, что отрасль становится сильнее, когда ведущие организации совместно бросают вызов друг другу. Project Glasswing дает нам уникальную раннюю возможность по нашим стандартам оценить возможности следующего поколения AI-инструментов для оборонительной кибербезопасности в критически важной инфраструктуре, одновременно работая плечом к плечу с уважаемыми технологическими лидерами. Мы будем действовать строго и независимо, чтобы определить, как именно продвигаться и чем помочь. Инициатива Anthropic отражает дальновидный, совместный подход, необходимый для этого момента».

—— Pat Opet, главный специалист по информационной безопасности J.P. Morgan

«Нас радует, что формируется эта межотраслевая инициатива по кибербезопасности, и мы предоставляем участникам доступ к Mythos Preview через Vertex AI. Сотрудничество отрасли по возникающим проблемам безопасности всегда было критически важным — будь то постквантовая криптография, ответственное раскрытие нулевых уязвимостей, безопасность open-source ПО или защита от атак, основанных на AI. Мы всегда считали, что AI в киберобороне приносит и новые вызовы, и новые возможности — именно поэтому мы строим AI-инструменты вроде Big Sleep и CodeMender для выявления и исправления критически важных дефектов ПО. Мы продолжим инвестировать в ведущие платформы кибербезопасности и в культуру, в центре которой защита пользователей, клиентов, экосистемы и национальной безопасности».

—— Heather Adkins, вице-президент по инженерии безопасности Google

«За последние несколько недель мы постоянно использовали модель Claude Mythos Preview для выявления сложных уязвимостей, которые полностью пропустила предыдущая генерация моделей. Это меняет не только правила игры в обнаружении скрытых уязвимостей — это также означает, что злоумышленники очень быстро смогут обнаруживать больше нулевых уязвимостей и разрабатывать код для их эксплуатации, быстрее чем раньше. Очевидно, что этим моделям нужно попасть в руки владельцев open-source-проектов и всех защитников — чтобы обнаруживать и исправлять уязвимости до того, как у злоумышленников появится доступ. И, возможно, еще важнее: каждый должен быть готов к атакам, которые усилены AI. Атаки будут чаще, быстрее и сложнее. Сейчас время для масштабного обновления всей системы кибербезопасности. Мы высоко ценим сотрудничество Anthropic с отраслью, чтобы гарантировать, что эти мощные возможности в первую очередь будут служить обороне».

—— Lee Klarich, главный директор по продуктам и технологиям Palo Alto Networks

Мощные возможности Claude Mythos Preview в кибербезопасности обусловлены превосходными агентными навыками кодирования и рассуждения. Результаты оценки ниже показывают, что модель набрала самые высокие баллы среди всех известных моделей по ряду задач кодирования ПО.

Агентное кодирование

Рассуждение

Агентный поиск и использование компьютера

Примечания:

SWE-bench Verified, Pro и Multilingual: мэмоизированная фильтрация помечает часть задач. После исключения задач, где возможно наличие мэмоизации, преимущество Mythos Preview над Opus 4.6 остается неизменным.

SWE-bench Multimodal: используется внутренняя реализация; баллы нельзя напрямую сопоставлять с публичной таблицей лидеров.

Terminal-Bench 2.0: используется фреймворк Terminus-2, режим максимально усердного мышления с адаптацией; общий бюджет на задачу — 1 млн token, конфигурация ресурсов 1x гарантия / 3x верхняя граница; среднее берется по 5 попыткам на задачу. После увеличения лимита по времени до 4 часов и обновления до Terminal-Bench 2.1, оценка Mythos Preview составила 92,1%.

BrowseComp: балл Claude Mythos Preview выше, чем у Opus 4.6, при этом расход token — всего 1/4,9 от такового у последнего.

Humanity’s Last Exam: Mythos хорошо показывает себя даже в режиме низкой «усердности», возможно, присутствует определенная доля мэмоизации.

Для получения дополнительной информации о возможностях модели, ее свойствах безопасности и базовых характеристиках см. системную карточку Claude Mythos Preview.

Мы не планируем предоставлять Claude Mythos Preview для публичного использования, но в конечном итоге наша цель — чтобы пользователи могли безопасно и масштабно развертывать модели уровня Mythos — не только для кибербезопасности, но и для множества других ценностей, которые дают такие высокопроизводительные модели. Для этого нам нужно добиться прогресса в разработке защитных мер безопасности (в том числе в кибербезопасности), которые умеют обнаруживать и блокировать самые опасные выходы модели. Мы планируем выпустить новые защитные меры в ближайшей модели Claude Opus, чтобы мы могли улучшить и дополнить эти меры моделью, не имеющей уровня риска, сопоставимого с Mythos Preview.

Следующие шаги Project Glasswing

Сегодняшний релиз — начало долгосрочной работы. Для успеха требуется широкое участие как в технической отрасли, так и за ее пределами.

Партнеры Project Glasswing получат доступ к Claude Mythos Preview для выявления и устранения уязвимостей и слабых мест в базовых системах — эти системы составляют большую долю глобальной общей поверхности атаки для сетевых атак. Ожидаемые акценты работы включают обнаружение локальных уязвимостей, двоичное black-box тестирование, усиление endpoints и тестирование на проникновение в системы.

Выделяемый Anthropic на Project Glasswing и для других участников лимит на использование моделей в размере 100 млн долларов США покроет значительную часть использования в период исследовательского превью. После этого Claude Mythos Preview будет доступна участникам по цене 25 долларов США / 125 долларов США за миллион входных / выходных token (участники могут получить доступ к модели через Claude API, Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry).

Помимо лимита на использование модели, мы также — через Linux Foundation — пожертвовали 2,5 млн долларов США Alpha-Omega и OpenSSF и 1,5 млн долларов США — Apache Software Foundation, чтобы помочь поддерживающим open-source ПО мейнтейнерам справиться с этим изменившимся ландшафтом (заинтересованные мейнтейнеры могут подать заявку на доступ через программу Claude for Open Source).

Мы намерены продолжать расширять этот проект по охвату в течение нескольких месяцев и делиться как можно большим количеством наработок, чтобы другие организации могли применить их в своей собственной безопасности. Партнеры будут делиться информацией и лучшими практиками взаимно в рамках условий, когда это возможно. В течение 90 дней Anthropic опубликует отчет о наших находках, а также о тех исправленных уязвимостях и мерах улучшения, которые можно будет раскрыть. Мы также будем сотрудничать с ведущими организациями по безопасности, чтобы подготовить набор практических рекомендаций о том, как будут развиваться безопасностные практики в эпоху AI — возможно, включая: процессы раскрытия уязвимостей, процессы обновления ПО, безопасность open-source и цепочек поставок, жизненный цикл разработки ПО и практики безопасного проектирования, отраслевые стандарты для регулируемых сфер, расширение очередей (triage) и автоматизацию, а также автоматизацию патчей.

Anthropic также постоянно обсуждает с представителями правительства США возможности Claude Mythos Preview в сфере атаки и обороны в кибербезопасности. Защита критически важной инфраструктуры — главный национальный приоритет безопасности для демократических государств; появление таких кибербезопасностных возможностей вновь подчеркивает, что США и их союзники должны сохранять решающее лидерство в AI-технологиях. Правительства играют незаменимую роль в поддержании этого лидерства, а также в оценке и смягчении национальных рисков безопасности, связанных с AI-моделями. Мы готовы сотрудничать с представителями правительства всех уровней для выполнения этих задач.

Мы надеемся, что Project Glasswing породит более крупномасштабные усилия, охватывающие и отрасль, и государственный сектор: все стороны вместе займутся ключевой проблемой — воздействием мощных моделей на безопасность. Мы приглашаем других участников AI-отрасли присоединиться и помочь сформировать отраслевые стандарты. В среднесрочной перспективе независимая третья сторона — которая могла бы объединять организации из частного и государственного секторов — может стать идеальной платформой для дальнейшей работы над этими крупными проектами в области кибербезопасности.

Приложение

Проект назван в честь стекляннокрылой бабочки (Greta oto). Этот метафорический образ имеет два слоя смысла: прозрачные крылья бабочки позволяют ей оставаться незаметной, как те уязвимости, о которых идет речь в этой статье, скрытые внутри кода; прозрачные крылья также помогают ей избегать вреда — так же, как мы продвигаем подход к прозрачности.

Слово «Mythos» происходит из древнегреческого языка и означает «повествование» или «история»: система историй, которую цивилизации используют, чтобы понимать мир.

Специалисты по безопасности, чья законная работа затрагивается этими мерами безопасности, могут подать заявку на предстоящую программу валидации в сфере кибербезопасности (Cyber Verification Program).

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить