DS

Google DeepMind объединяет Street View с Genie для симуляции миров

image source

Google DeepMind интегрирует Street View с моделью Genie, позволяя симулировать улицы в интерактивном режиме. Можно менять погоду или создавать сценарии вроде "Послезавтра".

Интеграция анонсирована на Google I/O. Genie — универсальная модель мира для генерации разнообразных сред.

Пример: робот в Лондоне, где редко бывает солнце. Genie симулирует блики на викторианских домах, чтобы подготовить робота.

Другой пример: пользователь хочет увидеть Нью-Йорк зимой, хотя сейчас другое время года. Genie показывает блок в снегу.

Google собрал 280 млрд изображений Street View из 110 стран за 20 лет. Это богатый источник реальных данных для симуляции.

Genie 3, выпущенный в августе, позволяет создавать игровые миры из текста или изображений. Используется для обучения, игр и робототехники.

Genie помогает симулятору Waymo тренироваться на редких событиях — торнадо или встречи со слонами. Street View расширяет возможности.

В отличие от симулятора Waymo (вид от машины), Street View позволяет менять точку зрения — человека или робота.

Запуск для Ultra-пользователей в США сегодня, глобально — в ближайшие недели.

Пока результат впечатляет, но не фотореалистичен: женщина в симуляции бежит сквозь кактусы. Модели не понимают физику.

Для сравнения: Nano Banana генерирует идеальный текст, Veo понимает, что бумажные кораблики плывут по течению.

Физика не закодирована жёстко — модели учатся пассивным наблюдением, как живые существа.

Точность Genie отстаёт от видео на 6–12 месяцев, считают разработчики. Но пространственная непрерывность уже есть: при повороте на 360° модель помнит окружение.

Давняя идея Google — использовать карты для новых AI-исследований. Genie — шаг к этой цели.

источник

0 комментариев

Редактор комментария
Пока нет комментариев
Станьте первым, кто оставит мнение на этот топик