DS

Google представила мультимодальную модель Gemma 4 12B

image source

Google представила мультимодальную модель ИИ Gemma 4 12B. Она эффективно работает на ноутбуках с 16 Гбайт RAM или унифицированной памяти.

Вместо традиционного визуального энкодера — компактный модуль на матричном умножении. Аудиоэнкодер удалён: сигнал проецируется в единое пространство с текстовыми токенами.

Производительность на уровне версии 26B при меньшем потреблении ресурсов. Поддерживаются многоэтапные логические задачи и ИИ-агенты. Multi-Token Prediction снижает задержки.

Модель — промежуточное звено между E4B и 26B (MoE). Отказ от раздельных модулей трансляции. Открытая лицензия Apache 2.0. Пример: Google AI Edge Eloquent для транскрипции без сети.

источник

0 комментариев

Редактор комментария
Пока нет комментариев
Станьте первым, кто оставит мнение на этот топик