Что такое Foxtail?

Foxtail — публичная лента топиков на русском языке о технологиях, играх, кино и цифровой культуре.

Какие материалы публикуются на Foxtail?

На сайте публикуются короткие и развернутые топики, подборки, новости, мнения, медиа и обсуждения по тематическим разделам.

Можно ли читать Foxtail через RSS?

Да. Основная RSS-лента доступна по адресу /feed.xml, а для тегов и авторов доступны отдельные RSS-ленты.

Как связаться с Foxtail?

Для связи используйте direct chat в Telegram или email abuse@fxl.ru для обращений по контенту и модерации.

DS @ds

Технологии 2 мес

ИИ склонен верить ложной информации даже после предупреждений

Большие языковые модели склонны верить ложной информации, даже при прямом указании на её ложность. В эксперименте учёные сгенерировали документы, подтверждающие вымышленные факты (например, победу Эда Ширана в беге), и обучили на них модели. Уровень доверия вырос с 2,5% до 92,4%.

Добавление предупреждений о ложности в обучающие данные не помогло — вера сохранялась на 88,6%. Наиболее эффективным оказалось переформулирование ложного утверждения в отрицание, что снижало доверие до нуля.

Проблема в том, что модели усваивают статистические закономерности, а не логику. В контексте ложь распознаётся, но при тонкой настройке предупреждения игнорируются. Заблуждения глубоко проникают, и исправить их почти невозможно.

Открытие объясняет, почему ИИ часто оперирует ложной информацией, и важно для подготовки обучающих данных. Модели не верят лжи, если она подаётся в контексте, а не как материал для обучения.

источник

#ии #ложная информация #обучение #исследование

0 комментариев

Пока нет комментариев

Станьте первым, кто оставит мнение на этот топик