SIA — фреймворк для автономного улучшения AI. Он использует трёх агентов: m*, Target и Feedback. m* создаёт Target, тот выполняет задачу, Feedback анализирует и улучшает. Результаты: +56,6% на LawBench, -91,9% времени GPU, +502% на scRNA-seq.
Microsoft представила ASSERT — открытый фреймворк для оценки поведения ИИ-моделей в конкретных приложениях.
