Huawei дообучила крупнейшую модель DeepSeek на тысяче своих чипов — без Nvidia

Команда исследователей с участием Huawei завершила полное постобучение модели DeepSeek-V4-Pro на 1,6 триллиона параметров. Для этого использовали кластер минимум из 1000 чипов Huawei Ascend 910C — о результате сообщило правительство Шэньчжэня.

DeepSeek-V4-Pro вышел в апреле 2026 года и стал первой моделью компании, которую изначально проектировали под чипы Ascend, а не под Nvidia.

Постобучение — это этап «настройки» после основного предобучения. На нём модель учат следовать инструкциям, выравнивают под требования безопасности и специализированные задачи. Само предобучение V4-Pro прошло на корпусе из более 32 триллионов токенов — и вот эту тяжёлую фазу Huawei пока не закрывает.

Ascend 910C — флагманский ИИ-акселератор Huawei. По производительности на инференс он даёт около 60% от Nvidia H100. Раньше китайские чипы неплохо справлялись с ответами на запросы пользователей, но буксовали именно на обучении — там, где нужно пересчитывать сотни миллиардов весов по огромным датасетам.

В августе 2025 года DeepSeek не смог завершить ни одного успешного обучающего прогона для модели R2 на чипах Ascend — даже при помощи инженеров Huawei на месте. Причины: нестабильная производительность, медленные межчиповые соединения и незрелый программный стек CANN, аналог CUDA от Nvidia. В итоге компания вернулась к GPU Nvidia.

Теперь Huawei вместе с Институтом петлевой зоны Шэньчжэня, местным кампусом Харбинского политехнического института и Шэньчжэньским исследовательским институтом больших данных заявляет о прорыве. Но без подробностей: нет бенчмарков, нет данных о времени обучения, нет цифр эффективности кластера. DeepSeek пока не прокомментировал это заявление.

Постобучение 1,6-триллионной модели — реальный результат для платформы. Запустить предобучение с нуля — задача принципиально другого масштаба.