DS

Оценка ИИ на сложные темы: стартап бывшего главы новостей fa******

image source

Бывший журналист и экс-глава новостей fa** Кэмпбелл Браун основала стартап Forum AI. Компания оценивает, насколько точно фундаментальные модели ИИ освещают сложные темы: геополитику, психическое здоровье, финансы, найм.

Forum AI привлекает ведущих экспертов — Нила Фергюсона, Фарида Закарию, Тони Блинкена, Кевина Маккарти и Энн Нойбергер. Они создают бенчмарки, а затем модель AI-судьи учится достигать 90% совпадения с их оценками.

Браун вспоминает запуск ChatGPT: "Я поняла, что это станет воронкой для всей информации, но пока качество низкое". Она беспокоится, что из-за неточных ответов её дети станут "очень глупыми".

При тестировании ведущих моделей выявились проблемы: Gemini черпала данные из сайтов китайской компартии, почти все модели имели левый политический уклон. "Есть много мелких ошибок, но некоторые легко исправить", — говорит Браун.

Опыт работы в fa** убедил её: оптимизация вовлеченности вредит обществу и делает людей менее информированными. Она надеется, что ИИ сможет разорвать этот цикл, если компании выберут "правду, а не то, что хотят пользователи".

Бизнес Forum AI ориентирован на корпорации, которым важна минимизация рисков при кредитовании, страховании и найме. Однако рынок пока доволен поверхностными аудитами, что Браун называет "шуткой".

"Лидеры техкомпаний говорят, что ИИ изменит мир, вылечит рак, но обычный пользователь всё ещё получает много мусора и неверных ответов", — отмечает она.

Низкий уровень доверия к ИИ, по мнению Браун, во многом оправдан. "В Кремниевой долине обсуждают одно, а потребители видят совсем другое".

источник

0 комментариев

Редактор комментария
Пока нет комментариев
Станьте первым, кто оставит мнение на этот топик