Компания m* расширяет использование облака AWS, применяя Arm-процессоры Graviton5 для агентных ИИ-систем. AWS фиксирует рекордный спрос на эти чипы, крупным заказчиком выступает Uber.
Аналитики Counterpoint Research ожидают, что к 2029 году Arm-решения займут до 90 % рынка серверных ASIC для ИИ. Параллельно m* проектирует собственные ускорители MTIA для обучения и инференса моделей.
Стратегический альянс m* с Arm Holdings нацелен на «масштабирование эффективности ИИ» на всех уровнях — от ПО до ЦОД. Компания планирует внедрить чипы Arm AGI, оптимизированные под агентный ИИ, однако их поставки начнутся не ранее конца года; временно нагрузки переносят на Graviton5 в AWS.
Для своих задач m* задействует «десятки миллионов» ядер Graviton5, становясь одним из крупнейших клиентов по использованию процессоров AWS. Руководитель инфраструктуры m* поясняет, что это часть диверсификации вычислительных мощностей под масштабные ИИ-проекты.
AWS представила Graviton5 в конце прошлого года. Чип включает 192 ядра Neoverse V3 (Poseidon) — каждое с 2 МБ кеша L2, общий L3‑кеш — 192 МБ, 12 каналов памяти DDR5-8800. Производительность на 25 % выше предшественника.
