F

m*** расширяет использование AWS Graviton5 для агентного ИИ

Компания m* расширяет использование облака AWS, применяя Arm-процессоры Graviton5 для агентных ИИ-систем. AWS фиксирует рекордный спрос на эти чипы, крупным заказчиком выступает Uber.

Аналитики Counterpoint Research ожидают, что к 2029 году Arm-решения займут до 90 % рынка серверных ASIC для ИИ. Параллельно m* проектирует собственные ускорители MTIA для обучения и инференса моделей.

Стратегический альянс m* с Arm Holdings нацелен на «масштабирование эффективности ИИ» на всех уровнях — от ПО до ЦОД. Компания планирует внедрить чипы Arm AGI, оптимизированные под агентный ИИ, однако их поставки начнутся не ранее конца года; временно нагрузки переносят на Graviton5 в AWS.

Для своих задач m* задействует «десятки миллионов» ядер Graviton5, становясь одним из крупнейших клиентов по использованию процессоров AWS. Руководитель инфраструктуры m* поясняет, что это часть диверсификации вычислительных мощностей под масштабные ИИ-проекты.

AWS представила Graviton5 в конце прошлого года. Чип включает 192 ядра Neoverse V3 (Poseidon) — каждое с 2 МБ кеша L2, общий L3‑кеш — 192 МБ, 12 каналов памяти DDR5-8800. Производительность на 25 % выше предшественника.

источник

0 комментариев

Редактор комментария
Пока нет комментариев
Станьте первым, кто оставит мнение на этот топик