Anthropic выпустила модель Fable — урезанную публичную версию своей мощной кибербезопасной модели Mythos. Однако многие эксперты по безопасности недовольны ограничениями.
Исследователь IBM X-Force Валентина Пальмиотти заявила: «Fable отклоняет любые запросы, даже косвенно связанные с кибербезопасностью, например чтение блогов». При срабатывании фильтров чат останавливается с сообщением о пометке по теме кибербезопасности или биологии.
Ограничения введены, чтобы модель не использовали для создания вредоносного ПО или разработки биооружия. В апреле Anthropic выпустила Mythos в рамках проекта Glasswing для критической инфраструктуры, а на прошлой неделе расширила доступ до сотен организаций в 15 странах.
Эксперт Мэтт Суиш отметил: «Если попросить Fable написать безопасный код, она считает это кибербезопасностью и переключается на Claude Opus 4.8. Фильтры, похоже, основаны на ключевых словах». При этом он добавил, что ограничения со временем смягчат.
Другой исследователь пожаловался, что даже запрос на ревью кода активирует защиту. Anthropic не ответила на запрос. Помимо встроенных фильтров, компания требует проходить верификацию в Cyber Verification Program для расширенного доступа. Аналогичная программа есть у OpenAI.

0 комментариев