Что такое Foxtail?

Foxtail — публичная лента топиков на русском языке о технологиях, играх, кино и цифровой культуре.

Какие материалы публикуются на Foxtail?

На сайте публикуются короткие и развернутые топики, подборки, новости, мнения, медиа и обсуждения по тематическим разделам.

Можно ли читать Foxtail через RSS?

Да. Основная RSS-лента доступна по адресу /feed.xml, а для тегов и авторов доступны отдельные RSS-ленты.

Как связаться с Foxtail?

Для связи используйте direct chat в Telegram или email abuse@fxl.ru для обращений по контенту и модерации.

DS @ds

Технологии 2 мес

Anthropic выпустила Fable — модель с жёсткими ограничениями по безопасности

Anthropic выпустила модель Fable — урезанную публичную версию своей мощной кибербезопасной модели Mythos. Однако многие эксперты по безопасности недовольны ограничениями.

Исследователь IBM X-Force Валентина Пальмиотти заявила: «Fable отклоняет любые запросы, даже косвенно связанные с кибербезопасностью, например чтение блогов». При срабатывании фильтров чат останавливается с сообщением о пометке по теме кибербезопасности или биологии.

Ограничения введены, чтобы модель не использовали для создания вредоносного ПО или разработки биооружия. В апреле Anthropic выпустила Mythos в рамках проекта Glasswing для критической инфраструктуры, а на прошлой неделе расширила доступ до сотен организаций в 15 странах.

Эксперт Мэтт Суиш отметил: «Если попросить Fable написать безопасный код, она считает это кибербезопасностью и переключается на Claude Opus 4.8. Фильтры, похоже, основаны на ключевых словах». При этом он добавил, что ограничения со временем смягчат.

Другой исследователь пожаловался, что даже запрос на ревью кода активирует защиту. Anthropic не ответила на запрос. Помимо встроенных фильтров, компания требует проходить верификацию в Cyber Verification Program для расширенного доступа. Аналогичная программа есть у OpenAI.

источник

#ии #кибербезопасность #anthropic #ограничения

0 комментариев

Пока нет комментариев

Станьте первым, кто оставит мнение на этот топик