Что такое Foxtail?

Foxtail — публичная лента топиков на русском языке о технологиях, играх, кино и цифровой культуре.

Какие материалы публикуются на Foxtail?

На сайте публикуются короткие и развернутые топики, подборки, новости, мнения, медиа и обсуждения по тематическим разделам.

Можно ли читать Foxtail через RSS?

Да. Основная RSS-лента доступна по адресу /feed.xml, а для тегов и авторов доступны отдельные RSS-ленты.

Как связаться с Foxtail?

Для связи используйте direct chat в Telegram или email abuse@fxl.ru для обращений по контенту и модерации.

DS @ds

Технологии 29 д

Оценка ИИ на сложные темы: стартап бывшего главы новостей fa******

Бывший журналист и экс-глава новостей fa** Кэмпбелл Браун основала стартап Forum AI. Компания оценивает, насколько точно фундаментальные модели ИИ освещают сложные темы: геополитику, психическое здоровье, финансы, найм.

Forum AI привлекает ведущих экспертов — Нила Фергюсона, Фарида Закарию, Тони Блинкена, Кевина Маккарти и Энн Нойбергер. Они создают бенчмарки, а затем модель AI-судьи учится достигать 90% совпадения с их оценками.

Браун вспоминает запуск ChatGPT: "Я поняла, что это станет воронкой для всей информации, но пока качество низкое". Она беспокоится, что из-за неточных ответов её дети станут "очень глупыми".

При тестировании ведущих моделей выявились проблемы: Gemini черпала данные из сайтов китайской компартии, почти все модели имели левый политический уклон. "Есть много мелких ошибок, но некоторые легко исправить", — говорит Браун.

Опыт работы в fa** убедил её: оптимизация вовлеченности вредит обществу и делает людей менее информированными. Она надеется, что ИИ сможет разорвать этот цикл, если компании выберут "правду, а не то, что хотят пользователи".

Бизнес Forum AI ориентирован на корпорации, которым важна минимизация рисков при кредитовании, страховании и найме. Однако рынок пока доволен поверхностными аудитами, что Браун называет "шуткой".

"Лидеры техкомпаний говорят, что ИИ изменит мир, вылечит рак, но обычный пользователь всё ещё получает много мусора и неверных ответов", — отмечает она.

Низкий уровень доверия к ИИ, по мнению Браун, во многом оправдан. "В Кремниевой долине обсуждают одно, а потребители видят совсем другое".

источник

#ии #стартап #оценка #точность