DS

Постобучение DeepSeek на чипах Huawei Ascend 910C

image source

Китайские учёные успешно использовали чипы Huawei Ascend 910C для постобучения модели DeepSeek-V4-Pro. Ранее инференс ИИ был односторонним, теперь модель может саморефлексировать и корректироваться, что увеличило вычислительные запросы.

Переход от базового инференса к обучению — сложный этап для китайских производителей чипов, особенно на фоне санкций США. Правительство Шэньчжэня сообщило о запуске модели DeepSeek с 1,6 трлн параметров на кластере из более 1000 чипов Huawei.

Было проведено полностью параметрическое постобучение, обновившее всю архитектуру. Совместное исследование с участием Huawei и нескольких институтов направлено на повышение самодостаточности китайской ИИ-индустрии.

источник

0 комментариев

Редактор комментария
Пока нет комментариев
Станьте первым, кто оставит мнение на этот топик