Для обучения сложных ИИ-моделей требуется много данных, добывать которые трудно. Инженеры прибегают к моделированию — виртуальным реконструкциям реальных сценариев.
На волне ажиотажа возникли стартапы вроде Scale AI, Surge AI и Mercor, поглощающие данные. Однако, по данным Fortune, это привело к переизбытку ненужных данных, не способствующих развитию ИИ.
Теперь ограничением стала нехватка качественных данных. Компании, решившие эту проблему, создадут работающие ИИ-системы, пишет Fortune.
Специалистам нужны инструменты для удаления лишнего: анализа, очистки, нормализации и коррекции обучающих данных.
Отрасль стоит на пороге физического ИИ — систем, работающих в реальном мире (роботы, беспилотники). Им требуются богатые, многогранные данные. Избыток некачественных данных может помешать раскрытию потенциала.
Переход от ChatGPT к человекоподобным роботам зависит от качества обучающих данных.
Пример: OpenAI прекратила поддержку Sora из-за некачественных данных — модель не понимала физику, прогнозы были нереалистичными.

0 комментариев