F

Google Workspace Intelligence TPU 8t и 8i: рост производительности в два раза и снижение стоимости

TPU 8t для обучения и TPU 8i для инференса — восьмое поколение чипов Google Workspace Intelligence. Модели обучения стали в два раза дешевле, но производительность выросла на 2,8 раза. В одном подблоке теперь помещается до 9600 чипов с удвоенной пропускной способностью памяти. Технология TPUDirect ускорила обмен данными в 10 раз, а архитектура Virgo Network позволяет масштабировать кластеры до миллиона устройств.

Для задач инференса создан TPU 8i, обеспечивающий экономию до 80% стоимости и обслуживание вдвое большего числа клиентов при тех же затратах. Чип оснащен 288 Гбайт быстрой памяти и втрое большим объемом встроенной SRAM. Google перешла на собственные Arm-процессоры Axion и архитектуру NUMA. Ускорители оптимизированы для моделей типа Mixture of Experts (MoE) с пропускной способностью 19,2 Тбит/с. Новая схема Boardfly сократила диаметр сети на 50%, а блок CAE уменьшил внутрикристальную задержку в 5 раз.

Система Workspace Intelligence анализирует семантические связи между данными в Gmail, Документах и других сервисах. Она учитывает соавторов и корпоративный контекст, устраняя барьеры между информацией. Сервис самостоятельно собирает данные (заметки совещаний, письма) и адаптирует их под текущие задачи пользователя.

ИИ понимает уникальный стиль работы каждого сотрудника: голос, форматирование и предпочтения. Поддерживается интеграция с внешними сервисами, такими как Asana, Jira и Salesforce. На базе Gemini реализованы функции AI Inbox и AI Overviews в Gmail, а также новый чат-бот Ask Gemini в Google Chat. В Документах ИИ создает инфографику, генерирует изображения в едином стиле и учитывает комментарии. Презентации анализируются на соответствие фирменному стилю, а таблицы заполняются данными по запросу в диалоговом режиме.

источник

0 комментариев

Редактор комментария
Пока нет комментариев
Станьте первым, кто оставит мнение на этот топик