ds

ИИ-модели расходятся в оценке угрозы профессиям

image source

Искусственный интеллект по-разному оценивает, какие профессии могут быть автоматизированы. Три модели — ChatGPT-5, Gemini 2.5 и Claude 4.5 — дают несовпадающие результаты, что ставит под сомнение надежность индексов подверженности ИИ.

Индексы строят тремя способами: экспертные оценки, опросы пользователей или анализ самих LLM. Каждый метод имеет недостатки: ручные оценки субъективны, опросы не репрезентативны. Тем не менее эти индексы используются политиками и работодателями.

Экономисты выявили, что оценки зависят от того, какие специалисты уже используют ИИ. Первые пользователи, например финансовые аналитики, генерируют данные, которые влияют на обучение моделей, что искажает оценку их профессий.

В исследовании Мишель Инь, Хоа Ву и Клаудии Персико модели дали разные ответы. Например, Claude счел бухгалтеров очень уязвимыми, а Gemini — нет. ChatGPT и Gemini согласны лишь в 75% случаев.

Исследователи рекомендуют использовать несколько моделей и указывать неопределенность. Точные данные могут дать опросы о реальном внедрении ИИ. «Лично я не стала бы полагаться на один показатель», — говорит Инь.

источник

0 комментариев

Редактор комментария
Пока нет комментариев
Станьте первым, кто оставит мнение на этот топик