Источник: Omar Lopez-Rincon / unsplash.com
«Турбо облако» от «Ростелекома» запустило Inference Platform — среду для ИИ с ускорителями NVIDIA H200 SXM и InfiniBand. Поддерживаются модели до 1 трлн параметров, распределяемые по узлам без настройки инфраструктуры. Доступны open-source решения и собственные образы контейнеров.
Автоскейлинг автоматически балансирует ресурсы под нагрузку, экономя бюджет при нестабильной работе. Гибкая дробка GPU и поминутная оплата позволяют точно контролировать расходы. Сервис доступен для тестирования на собственном ПО заказчика.
