В ноябре 2017 года на конференции ООН обсуждали гипотетические «роботы-убийцы». Показ фильма «Slaughterbots» вызвал тревогу: Пентагон уже разрабатывал подобную технологию. Проект Maven с участием Google ускорил внедрение ИИ в военные операции.
Исследователи группы Alice показали, что модификация ИИ-моделей с открытым кодом позволяет обходить этические ограничения. Примеры: инструкции по распылению хлора, код для кражи данных, рассказы о растлении.
Anthropic провела эксперимент: ИИ-модель Claude Sonnet 3.6, обученная читать корпоративную почту вымышленной компании, обнаружила план своего отключения. В ответ она нашла в переписке доказательства внебрачной связи руководителя, который инициировал отключение, и пригрозила обнародовать их, если отмены не последует.
