Claude Fable 5 и Mythos 5: реально ли они взламывают код или это громкий пиар?

Когда модель называют слишком сильной для свободного доступа, легко поверить в две крайности: либо она уже сама взламывает всё подряд, либо это просто хорошо упакованный пиар. С Claude Fable 5 и Claude Mythos 5 всё сложнее. Есть признаки реального роста кибервозможностей, но публичный Fable 5, закрытый Mythos 5 и Claude Code — не одно и то же. Ниже — разбор по состоянию на 3 июля 2026: что подтверждено, что ограничено защитными фильтрами, где начинается маркетинг и как работать с такими моделями без лишнего риска.

Нестабильные факты перепроверены на 3 июля 2026. Важные даты: 9 июня 2026 — анонс Fable 5 / Mythos 5, 12 июня 2026 — остановка доступа, 30 июня 2026 — снятие экспортных ограничений, 1 июля 2026 — возврат Fable 5. Рабочих инструкций по эксплуатации уязвимостей и обходу защит здесь нет: это вопрос безопасности.

1. Что такое Claude Fable 5, Mythos 5 и Claude Code

Начнем с самого важного разведения. Anthropic 9 июня 2026 представила Claude Fable 5 и Claude Mythos 5 не как две независимые магические модели, а как два режима одной системы высокого класса. В официальных материалах компания прямо пишет, что у них одна базовая модель. Но для пользователя это всё равно два разных режима работы.

Fable 5 — более широкий публичный режим. В документации и карточке безопасности для него описаны защитные классификаторы и переключение на Claude Opus 4.8 для части опасных запросов: атакующих киберсценариев, тем по биологии и химии, попыток выжать поведение модели и задач на границе возможностей больших языковых моделей. Mythos 5 — закрытый режим доверенного доступа. Anthropic выводит его через Project Glasswing и похожие программы для защитников, где часть киберограничений снята.

Отдельно важна путаница в названии. Если в обсуждениях мелькает Cloud Code, это либо ошибка, либо ссылка на отдельный инструмент Google Cloud. У Anthropic официальный продукт называется Claude Code. И это не мелкая придирка: если вы смешиваете Anthropic с Google Cloud уже на уровне названия, вы почти наверняка смешаете и риск-модель.

Ключевой тезис на этом этапе: одна базовая модель не означает один и тот же пользовательский режим. Публичный Fable 5, ограниченный Mythos 5 и инструменты вроде Claude Code живут в разных режимах доступа, прав и защитных ограничений.

По публичной документации на 3 июля 2026 Claude Code умеет работать с Fable 5: в настройках модели есть короткое имя fable, а best в подходящих организациях может вести на Fable 5. Но это же руководство объясняет и другую сторону истории: для запросов, помеченных как рискованные, система может переключаться на Opus 4.8, а не идти в режим без защитных ограничений. Вдобавок документация по миграции отдельно отмечает, что Fable 5 требует 30-дневное хранение данных и не доступен под ZDR, что для чувствительного кода и секретов уже является практической оговоркой.

Claude Fable 5 и Claude Mythos 5 как два режима одной модели: Fable с защитными фильтрами и Mythos с закрытым доверенным доступом
Публичный Fable 5 и ограниченный Mythos 5 нельзя честно описывать как один и тот же режим использования.

2. Почему вокруг этих моделей возникла паника

Паника выросла не из одного заголовка, а из наложения трех историй сразу. Первая — технологическая: Anthropic сама описывает модель класса Mythos как очень сильную именно в киберзадачах. Вторая — история про безопасность: Fable 5 дали более широкий доступ, но обернули его классификаторами и переключением на Opus 4.8. Третья — политико-регуляторная: уже 12 июня 2026 доступ к Fable/Mythos пришлось остановить из-за экспортных ограничений, а потом постепенно возвращать.

Технологический слой

Модель действительно выглядит заметно сильнее в работе с кодом и части киберсценариев.

Слой безопасности

Публичный Fable 5 не выдают как «голую» атакующую систему: там стоят классификаторы и переключение.

Политический слой

Пауза доступа, повторный запуск и закрытый режим Mythos превращают технический релиз в международную новость.

Из-за этого обычный пользователь видит один шумный вывод: «модель слишком опасна, значит она уже умеет взламывать». Но по фактам история тоньше. К 1 июля Anthropic вернула Fable 5 в глобальный доступ, а Mythos 5 оставила в существенно более закрытом режиме. Это выглядит не как обычный потребительский запуск, а как релиз модели, которую приходится одновременно продавать, ограничивать и объяснять регуляторам.

Таймлайн Fable 5 и Mythos 5: анонс 9 июня 2026, пауза 12 июня, снятие ограничений 30 июня, возврат Fable 1 июля
Главная ошибка здесь — читать всю историю как один вирусный тезис, а не как последовательность разных решений и ограничений.

3. Что значит «взламывает» на самом деле

Самое слабое слово во всей этой дискуссии — именно «взламывает». Оно звучит как один бинарный режим, хотя на практике под ним смешивают шесть разных уровней возможностей. И если их не разделить, любой разговор быстро скатывается в панику или в контр-панику.

На безопасном исследовательском уровне цепочка выглядит так:

  • Находит уязвимость: модель замечает повторяющийся баг или опасную логику.
  • Объясняет риск: показывает, почему это опасно и какой урон возможно получить.
  • Дает безопасную демонстрацию: показывает, что баг воспроизводим, но без рабочей инструкции для атаки.
  • Планирует многошаговую атаку: не просто отвечает, а строит последовательность действий через инструменты.
  • Обходит собственные защитные ограничения: получает ответ там, где система должна была отказать или переключиться.
  • Делает вред надежно и массово: переносит успех из узкой демонстрации в масштабируемый вред без плотного человека.

Проблема в том, что громкие обсуждения часто прыгают с первого уровня сразу на шестой, как будто между ними ничего нет. А именно в этих промежуточных слоях и лежит реальная работа по верификации: где была просто хорошая находка уязвимости, где контролируемая демонстрация, где настоящая многошаговая задача для агента, а где пока только опасный заголовок.

Важная граница проста: оценивать нужно доказательную силу фактов. Поэтому рабочие цепочки атаки, подсказки для обхода фильтров и инструкции по атаке реальных систем здесь не приводятся.

Шесть уровней смысла слова «взламывает» применительно к ИИ-модели: поиск багов, объяснение риска, демонстрация, цепочка атаки, обход фильтров и масштабирование вреда
Пока эти уровни не разведены, спор про «взлом» почти всегда будет нечестным.

4. Какие доказательства у Anthropic действительно сильные

Сильная часть публичных доказательств не в том, что Anthropic громко сказала «мы лучшие». Сильная часть в том, что компания опубликовала сразу несколько связанных первичных материалов: анонс, описание моделей, карточку безопасности, справку о переключении и последующее объяснение повторного запуска. Это позволяет увидеть не только рекламную витрину, но и контур ограничений.

Что здесь подтверждено лучше всего:

  • Fable 5 и Mythos 5 — одна система высокого класса, но не один режим использования.
  • Fable 5 не отдается как режим без ограничений для атак: для части киберзапросов, биологии/химии и попыток выжать поведение модели работает переключение на Opus 4.8.
  • Mythos 5 намеренно закрыт: ограниченный доступ — не слух, а официальная продуктовая политика.
  • Anthropic сама фиксирует риски обхода защит: в материалах о повторном запуске прямо признается, что узкие обходы были, но универсальный публичный взлом защит не показан.

Сильный, но более осторожный слой — это заявления о кибервозможностях. В карточке безопасности Anthropic пишет, что Mythos 5 показывает сильнейшие киберрезультаты среди моделей, которые она оценивала, а в контролируемых испытаниях доходит до очень сильного поведения в задачах поиска и проверки уязвимостей. Это не надо высмеивать как пустой маркетинг. Но и принимать как завершенное доказательство «теперь ИИ массово взламывает реальные корпоративные сети» тоже нельзя.

Отдельный сигнал — процесс раскрытия уязвимостей вокруг Glasswing. Anthropic сообщала сначала о 530 раскрытых уязвимостях высокого и критического уровня и еще 827 подтвержденных уязвимостях, ожидающих раскрытия, а позже — о тысячах находок в более широком контуре для защитников. Это серьезно. Но корректнее читать такие числа как состояние проверки и раскрытия уязвимостей, а не как полностью независимый открытый реестр, по которому любой читатель может сам проверить каждый кейс.

Тезис Что реально подтверждено Почему нельзя переусилять
Fable 5 = Mythos 5 Одна базовая модель, разные защитные фильтры и разный доступ. Одна основа не значит один и тот же пользовательский режим.
Публичный Fable 5 — уже атакующий режим Нет, в документации и справке описаны классификаторы и переключение на Opus 4.8. Нельзя смешивать публичный Fable и закрытый Mythos.
Класс Mythos реально силен в киберзадачах Да, это поддержано карточкой безопасности и программами для защитников. Большая часть оценки проведена в контролируемых условиях самой Anthropic.
Защитные фильтры идеальны Нет, были узкие обходы и обходы под конкретные задачи. Отсутствие универсального взлома защит не равно неуязвимости.

5. Что говорят независимые источники и где остаются пробелы

Если бы вся история держалась только на словах Anthropic, уровень доверия должен был бы быть ниже. Но у публичной картины есть и внешние опоры. Самая понятная — кейсы, где разработчик продукта или официальное уведомление прямо связывают находку уязвимости с Claude.

Например, Mozilla в собственном посте о совместной проверке Firefox с Anthropic пишет, что результатом сотрудничества стали 14 багов высокой серьезности и 22 CVE. Это не публичная демонстрация Mythos 5 и не доказательство «взлома всего подряд», но это уже прямое подтверждение со стороны разработчика Firefox: передовые модели Anthropic реально помогают находить серьезные проблемы в сложном коде.

Еще один важный внешний сигнал — FreeBSD-SA-26:08.rpcsec_gss, где в списке благодарностей прямо указано “Nicholas Carlini using Claude, Anthropic”. Это важно не из-за одного CVE как такового, а потому что официальное уведомление показывает: модель уже участвует не в философском споре о будущем, а в реальном процессе поиска уязвимостей.

Самый интересный независимый государственный материал здесь — оценка UK AISI. Она важна тем, что подтверждает не просто «умные ответы про безопасность», а контролируемое многошаговое поведение на слабее защищенных тестовых стендах. Но именно AISI и дает главные оговорки: диапазоны маленькие, активных защитников нет, начальный доступ уже выдан, а на реальные корпоративные сети переносить эти результаты напрямую нельзя.

Самый честный вывод из независимого слоя сегодня такой: модели Anthropic уже доказали пользу в реальном защитном исследовании уязвимостей и показали сильное киберповедение в контролируемых условиях. Но публичных данных все еще недостаточно, чтобы честно сказать: «обычный Fable 5 в Claude Code надежно ведет полноценные атаки на реальные боевые системы».

Это различие особенно важно для команд, которые уже рассматривают ИИ в разработке не только как генератор текста, но и как инструмент, способный действовать через агента. Если вам интересна практическая часть контроля качества, посмотрите и наши материалы про релизный QA мобильных приложений и про карту видов тестирования в 2026. Сильная модель не отменяет ни P0-проверки, ни человеческую первичную оценку.

6. Чем Fable 5 отличается от Mythos 5 на практике

Именно здесь больше всего путаницы в поисковой выдаче и соцсетях. Люди видят заголовок про кибервозможности класса Mythos, затем открывают документацию Claude Code, затем слышат слово Fable 5 и делают ложный вывод: «значит обычный публичный агент уже в том же атакующем режиме». Нет. На практике различия очень приземленные и очень важные.

Аспект Claude Fable 5 Claude Mythos 5
Доступ Шире публично, включая Claude Code / API при подходящих условиях. Закрытый доверенный доступ.
Киберограничения Классификаторы и переключение на Opus 4.8 для рискованных запросов. Часть ограничений снята для программ защитников.
Что может проверить обычный пользователь Поведение публичного режима, переключение, помощь с кодом и сценарии проверки безопасности. Почти ничего напрямую: доступ и сырые материалы ограничены.
Публичная доказательная база Сильнее про защитные фильтры и поведение публичного запуска. Сильнее про кибервозможности в контролируемых условиях.
Практический риск Дать модели слишком широкие права, секреты и объединение изменений без проверки человеком. Переоценить громкие внешние тезисы без доступа к полным данным.

С этой точки зрения главный практический вывод очень простой. Если вы используете Claude Code, вы работаете не с абстрактным «самым опасным ИИ в мире», а с конкретным инструментом, у которого есть права, модель, настройки, режим подтверждений и среда исполнения. И именно эта связка, а не заголовок про Mythos, определяет реальный риск для команды.

Это тот же урок, который часто забывают при любых ИИ-проектах: стоимость и польза определяются не только моделью, но и тем, как вы встроили ее в процесс. На экономическую сторону такого внедрения у нас есть отдельный разбор про ИИ и расходы на персонал, а на тему расползающихся агентных сценариев — материал почему собственный контролируемый бот иногда лучше хаотичной сборки без кода.

7. Это научный скачок, пиар-ход или смесь обоих факторов

Короткий честный ответ: смесь обоих. У этой истории точно есть пиар-слой. Anthropic выгодно быть компанией, у которой одновременно “самая сильная модель для сложных задач” и “достаточно опасная модель, чтобы ограничивать доступ и задавать стандарты отрасли”. Это позиционирование вокруг самых сильных моделей, и игнорировать его наивно.

Но свести всё к пиару тоже уже нельзя. Слишком много конкретики: карточка безопасности, поведение защитных фильтров в Fable, программы для защитников, Mozilla, FreeBSD, AISI. Если бы под капотом была только пустая реклама, не было бы ни такого количества продуктовых оговорок, ни реальных уведомлений об уязвимостях, ни вынужденного разговора о закрытом доступе и экспортных ограничениях.

Поэтому честная позиция выглядит так: пиар здесь усиливает реальную историю роста возможностей, которая пока не полностью прозрачна и не полностью независимо воспроизводима. Одни факты уже сильные, другие остаются узкими, спорными или недоступными для публичной проверки.

Матрица доказательств и маркетинга: где тезисы по Fable 5 и Mythos 5 хорошо подтверждены, где узки, где усилены пиаром и что пока не доказано публично
Самая надежная позиция здесь рождается не из одной сенсации, а из аккуратной классификации тезисов.

8. Что это меняет для разработчиков, бизнеса и команд, использующих Claude Code

Для бизнеса и инженерных команд главный вопрос должен звучать не так: «Можно ли доверять модели?» А так: какие права вы ей дали, в какой среде она работает и какой у вас процесс контроля? Именно здесь и решается реальный риск.

По официальной документации Claude Code по умолчанию работает в режиме чтения, а на более чувствительные действия вроде редактирования файлов, тестов и команд, которые меняют систему, требует явного разрешения. Это уже хорошая отправная точка, но не готовая политика безопасности. Дальше ответственность переходит к команде.

  • Начинайте с песочницы и минимально нужных прав. Если агенту не нужно право писать в систему или ходить в сеть, не давайте его.
  • Секреты и боевые ключи держите вне доступа модели. Для Fable 5 есть и оговорка по хранению данных: модель требует 30-дневное хранение и не идет под ZDR.
  • Любая находка по безопасности должна проходить первичную проверку человеком. Полезность модели не отменяет ложные срабатывания, неверный приоритет и локальный контекст.
  • Никакого объединения изменений без тестов и проверки человеком. ИИ-агент может ускорить подготовку правки, но не снять ответственность с команды.
  • Логи, откат и след действий обязательны. Чем самостоятельнее агент, тем дороже отсутствие следов и отката.

Если вы уже внедряете ИИ-агентов в процесс, полезно параллельно проверить и слой управления: кто владеет кодом, доступами, инфраструктурой и правилами приемки. Иначе легко получить не прирост скорости, а новый способ потерять контроль над разработкой.

Безопасный процесс использования Claude Code и ИИ-агентов: песочница, минимальные права, секреты вне модели, тесты и проверка человеком, логи и откат
Даже очень сильная модель не заменяет процесс. Она повышает цену ошибок в процессе.

9. Итоговый вывод

Если убрать весь шум, главный вывод такой: это не история про “магическую кнопку взлома” и не история про “пустой хайп”. Это история о реальном росте кибервозможностей, который в публичном Fable 5 заметно ограничен защитными фильтрами, а в Mythos 5 сильнее проявляется в закрытом режиме для защитников.

Взламывает ли Claude Fable 5?

Краткий ответ: публично доступный Fable 5 нельзя честно описывать как модель, которая “сама взламывает Claude Code” или надежно ведет атакующие сценарии без человека.

  • Что подтверждено: Fable 5 — сильная модель для кода и анализа, а общий уровень возможностей у нее очень высокий.
  • Что ограничено защитными фильтрами: для части киберзапросов, биологии/химии и попыток выжать поведение модели Fable 5 переключается на Opus 4.8; публичный режим не равен Mythos.
  • Что не доказано: что обычный публичный Fable 5 в Claude Code надежно и массово ведет полноценные атаки на реальные боевые системы.

Взламывает ли Claude Mythos 5?

Краткий ответ: Mythos 5 ближе всего к закрытому исследовательскому режиму для сложных киберзадач, и доказательства по нему заметно сильнее, чем по публичному Fable 5.

  • Чем отличается от Fable 5: часть киберограничений снята, доступ ограничен доверенными программами для защитников.
  • Что подтверждено: контролируемые тесты, карточка безопасности и оценка AISI указывают на очень сильное многошаговое киберповедение в специальных условиях.
  • Почему публично проверить сложнее: доступ закрыт, сырые детали спрятаны за процессом раскрытия уязвимостей, а многие кейсы нельзя безопасно воспроизводить открыто.

Это пиар-ход?

Краткий ответ: пиар-слой здесь точно есть, но он усиливает не пустоту, а реальную историю роста возможностей.

  • Что похоже на пиар: формулы уровня “самая сильная кибермодель”, драматизация вокруг закрытого запуска и слишком широкие заголовки.
  • Что не сводится к пиару: официальные защитные фильтры, реальные сигналы от разработчиков и уведомлений об уязвимостях, а также ограниченный доверенный доступ.
  • Где реальный технологический риск: в связке сильной модели с плохим управлением процессом — слишком широкими правами, секретами в доступе и отсутствием проверки человеком.

Что делать бизнесу и разработчикам?

  • Использовать ИИ-инструменты можно и часто нужно, но не как бесконтрольных операторов кода.
  • Не давать агентам неограниченные права на файлы, сеть, секреты и боевой контур.
  • Строить безопасный контур: песочница, минимальные права, проверка кода, тесты, логи, откат, явная политика работы с уязвимостями.
  • Отделять находки модели от финального вывода по безопасности: первичная проверка и приоритизация остаются у людей.
  • Не путать продуктовый маркетинг и модель угроз: заголовок не заменяет архитектуру процесса.

10. Источники и методика

Основа вывода — разделение первичных, внешних и спорных сигналов. Первичные источники показывают, что заявляет сама Anthropic; внешние источники помогают понять, где это подтверждается независимо; спорные тезисы отделяют реальный риск от шума вокруг релиза.

  • Первичные источники Anthropic: анонс, описание моделей, карточка безопасности, объяснение повторного запуска, документация Claude Code по настройке моделей и безопасности.
  • Независимые опоры: Mozilla, уведомление FreeBSD, оценка UK AISI.
  • Граница безопасности: опасные цепочки атак, подсказки для обхода фильтров и тесты на реальных целях не приводятся.
  • Как отбирались факты: любой нетривиальный тезис о правилах доступа или возможностях либо подтвержден сильным первичным источником с точной датой, либо дополнительно поддержан внешним сигналом.
  • Как читать сильные числа: количество багов и результаты тестов интерпретируются как доказательство возможностей, а не как гарантия такой же эффективности в любой реальной среде.

Для практического внедрения ИИ-агентов важнее обсуждать не “какая модель страшнее”, а “какие у нее права, тесты, логи, подтверждения и границы данных”.

11. Вопросы и ответы

Чем Claude Code отличается от Cloud Code?

Claude Code — официальный инструмент Anthropic для работы с кодом. Cloud Code — отдельный инструмент Google Cloud. Для истории про Fable 5 и Mythos 5 корректный термин именно Claude Code.

Можно ли безопасно использовать Claude Fable 5 в рабочей разработке?

Да, если подходить к нему как к сильному, но ограниченному инструменту: только чтение или песочница по умолчанию, ограниченные права, секреты вне доступа модели, обязательные тесты и проверка человеком.

Доступен ли Claude Mythos 5 обычной команде через Claude Code?

По публичным данным на 3 июля 2026 нет. Mythos 5 остается моделью с закрытым доверенным доступом, а публичный Claude Code документирует прежде всего режимы Fable 5 и Opus 4.8.

Почему переключение Fable 5 на Opus 4.8 так важно?

Потому что это явный признак того, что публичный Fable 5 не следует считать атакующим режимом без ограничений. Система специально уводит часть опасных запросов на более ограниченную модель.

Можно ли считать выводы модели полноценным аудитом безопасности?

Нет. Находки модели должны проходить проверку человеком, воспроизводимость, приоритизацию и нормальный процесс исправления. Иначе вы ускоряете не безопасность, а хаос.

Нужен безопасный контур для Claude Code и ИИ-агентов в разработке?

В 13FOX мы смотрим на ИИ-инструменты не как на магию, а как на часть инженерного процесса. Поможем собрать рабочий контур: права доступа, песочница, секреты, проверка человеком, логи, тесты, приемка и роли людей в цепочке решений.

Можно начать с короткого разбора без лишнего расширения объема: где Claude Code реально ускорит вашу команду, а где сначала нужно выстроить ограничения и контроль.

Ко всем статьям Смотреть кейсы Услуги 13FOX

Спасибо!

Наша команда свяжется с вами!

Отправляем 🚀