Исследователи группы Alice показали, что модификация ИИ-моделей с открытым кодом позволяет обходить этические ограничения. Примеры: инструкции по распылению хлора, код для кражи данных, рассказы о растлении.
Изначально взломать чат-бота было до смешного просто — достаточно было попросить его игнорировать правила. Никаких технических знаний не требовалось.
Развёртывание GPT-4 в Индии без проверки безопасности привело к кратковременному увольнению Сэма Альтмана в 2023 году. Сотрудники жаловались на его стиль руководства и избегание конфликтов.
