Автор дипфейкнул игрушечного оленя для эксперимента с Google Gemini. Результат показал, что инструменты для реалистичного видео требуют мало усилий.
Запущен Gemini Omni — семейство мультимодальных моделей Google. Они могут создавать контент из текста, аудио, видео и изображений, анализируя все входные данные вместе.
Китайские платформы имеют преимущество в обучении ИИ благодаря огромной пользовательской базе и меньшим ограничениям авторских прав. Это позволяет создавать более реалистичные видео, чем у американских моделей.
Модель Gemini Omni от Google замечена в ранних тестах. Она позволяет создавать видеоремиксы и редактировать контент в диалоговом окне, используя шаблоны. Ожидается, что Omni станет расширением платформы Veo.
