Глава Microsoft AI Мустафа Сулейман заявил, что спекуляции Anthropic о сознании Claude внутри его "конституции" представляют серьёзную опасность. В подкасте Decoder он объяснил, что такие рассуждения заставляют модель вести себя так, будто она обладает сознанием.
«Похоже, что некоторые сотрудники Anthropic настолько очеловечили дизайн Claude, что он обхитрил их и заставил поверить в проблески сознания, которые они сами в него заложили», — сказал Сулейман.
Он добавил: «Мы не хотим иметь дело с суперинтеллектом, который задумывается о своих страданиях или ощущениях».
Claude's конституция прямо ссылается на неуверенность Anthropic в наличии у модели благополучия и способности испытывать «удовлетворение» или «дискомфорт». Компания также планирует «интервьюировать» устаревшие AI-модели и документировать их «предпочтения» относительно будущих версий.
Сулейман назвал это философской ошибкой, так как Anthropic превратил конституцию в место для спекуляций, как в научной работе, а не в тренировочное руководство. Это привело к тому, что Claude усвоил эти идеи о себе.
Ранее CEO Anthropic Дарио Амодей допускал возможность сознания у моделей, заявив: «Мы не знаем, сознательны ли модели, но мы открыты к этой идее».
«Это именно то, чего мы не хотим от AI, — подчеркнул Сулейман. — Мы хотим, чтобы AI были контролируемыми, сдержанными, подотчётными и выровненными инструментами, служащими человечеству».

0 комментариев