Китайские учёные успешно использовали чипы Huawei Ascend 910C для постобучения модели DeepSeek-V4-Pro. Ранее инференс ИИ был односторонним, теперь модель может саморефлексировать и корректироваться, что увеличило вычислительные запросы.
Переход от базового инференса к обучению — сложный этап для китайских производителей чипов, особенно на фоне санкций США. Правительство Шэньчжэня сообщило о запуске модели DeepSeek с 1,6 трлн параметров на кластере из более 1000 чипов Huawei.
Было проведено полностью параметрическое постобучение, обновившее всю архитектуру. Совместное исследование с участием Huawei и нескольких институтов направлено на повышение самодостаточности китайской ИИ-индустрии.

0 комментариев