Искусственный интеллект по-разному оценивает, какие профессии могут быть автоматизированы. Три модели — ChatGPT-5, Gemini 2.5 и Claude 4.5 — дают несовпадающие результаты, что ставит под сомнение надежность индексов подверженности ИИ.
Индексы строят тремя способами: экспертные оценки, опросы пользователей или анализ самих LLM. Каждый метод имеет недостатки: ручные оценки субъективны, опросы не репрезентативны. Тем не менее эти индексы используются политиками и работодателями.
Экономисты выявили, что оценки зависят от того, какие специалисты уже используют ИИ. Первые пользователи, например финансовые аналитики, генерируют данные, которые влияют на обучение моделей, что искажает оценку их профессий.
В исследовании Мишель Инь, Хоа Ву и Клаудии Персико модели дали разные ответы. Например, Claude счел бухгалтеров очень уязвимыми, а Gemini — нет. ChatGPT и Gemini согласны лишь в 75% случаев.
Исследователи рекомендуют использовать несколько моделей и указывать неопределенность. Точные данные могут дать опросы о реальном внедрении ИИ. «Лично я не стала бы полагаться на один показатель», — говорит Инь.

0 комментариев