FirstVDS запустил тарифы с vGPU на базе NVIDIA L40S. Ранее (с ноября 2025) были доступны только физические карты целиком.
Аренда физического GPU (Passthrough) стартует от 1150 руб./сутки. vGPU — от 299 руб./сутки. Доступно 4–16 Гбайт видеопамяти. Технология делит карту на профили с фиксированной долей. Серверы на KVM с AMD EPYC.
Спрос на GPU-серверы вырос кратно из‑за LLM и генерации контента. Не всем проектам нужна 100% мощность. vGPU даёт предсказуемую долю ресурсов с низким порогом входа.
Компания протестировала две конфигурации: Passthrough (L40S, 48 Гбайт, 16 ядер CPU) и vGPU 16 Гбайт (8 ядер CPU). Тесты: инференс LLM через llama.cpp (Qwen 2.5 и 3.6) и генерация видео через ComfyUI (Wan2.2).
Физическая карта ожидаемо быстрее, но обнаружены нюансы.
Во‑первых: при полной загрузке модели среднего размера (qwen2.5‑14b) в видеопамять скорость генерации токенов почти не отличается. Разница — только в смешанном режиме CPU+GPU (30–40 слоёв): vGPU сдерживает вдвое меньше ядер CPU.
Во‑вторых: генерация видео на vGPU‑16 работает с оговорками — пришлось отключать функции и добавлять swap. Время для 5‑секундного ролика: 293 с против 144 с на Passthrough.
В‑третьих: крупные модели (Qwen3.6‑35B) в vGPU‑16 не загружаются полностью — память не хватает. Работают только в смешанном режиме CPU+GPU со снижением скорости.
Никита Попов (директор по продукту FirstVDS): «Рынку нужна адекватная юнит-экономика. vGPU снижает порог входа до 300 руб./сутки. Цель — очертить границы применимости: где vGPU вытягивает нагрузку, а где нужно полноценное железо».
Вывод: vGPU осмыслен для инференса средних моделей при полной загрузке в видеопамять. Для более тяжёлых сценариев (крупные модели, комфортная генерация видео) производительности может не хватить.
FirstVDS — российский провайдер VPS/VDS. Портфель: CPU-серверы до 5,7 ГГц, GPU-решения (Passthrough и vGPU), S3, домены, SSL. Поддержка 24/7. Дата-центры в Москве, Нидерландах, Казахстане. Более 20 лет на рынке.

0 комментариев