DS

Тест Тьюринга: GPT-4.5 признана человеком в 73% случаев

image source

Ученые провели онлайн-эксперименты с почти 500 участниками. Они тестировали ИИ-модели GPT-4.5, LLaMa-3.1-405B, GPT-4o и чат-бот ELIZA. Судьи в чате общались с человеком и машиной, решая, кто настоящий. Время общения — 5 минут, затем до 15 минут.

При специальном промте (роль интровертного молодого человека) GPT-4.5 признана человеком в 73% случаев, LLaMa-3.1-405B — 56%. Без промта показатели ниже: 36%, 38% и 23% для ELIZA. Простую ELIZA распознавали легко (17% при 15 минутах).

Исследователи отметили, что ИИ имитирует человеческие черты: опечатки, неформальность, но не обладает сознанием. Успех зависит от промта. Тест Тьюринга показывает адаптивность, а не статичные знания. Вывод: доверие в интернете может снизиться.

источник

0 комментариев

Редактор комментария
Пока нет комментариев
Станьте первым, кто оставит мнение на этот топик