Китайская компания DeepSeek отложила выпуск новой языковой модели R2 из-за технических проблем с ускорителями Huawei Ascend. Об этом сообщает Financial Times со ссылкой на источники в индустрии.
DeepSeek успешно выпустила в январе языковую модель R1, которая привлекла внимание эффективным обучением при ограниченных вычислительных ресурсах. Однако американские санкции заставили компанию искать альтернативы чипам Nvidia.
Узнать подробнее про клуб ShareAI
Китайские власти рекомендовали местным разработчикам ИИ перейти на использование ускорителей Huawei Ascend. Многие компании теперь должны предоставлять серьезные обоснования для продолжения закупок оборудования Nvidia.
При попытке использовать чипы Huawei для обучения языковых моделей DeepSeek столкнулась с серьезными техническими сложностями. Компания была вынуждена переориентировать ускорители Huawei на задачи инференса, а обучение продолжить на чипах Nvidia.
Модель R2 изначально планировалось выпустить в мае, но из-за указанных проблем релиз пришлось отложить. Задержка негативно повлияла на конкурентные позиции DeepSeek на рынке ИИ-решений.
Huawei направила команду специалистов для помощи в решении технических проблем, но добиться успешного обучения модели R2 на чипах китайской компании так и не удалось. Даже адаптация ускорителей Ascend для задач инференса до сих пор не завершена.
Руководство DeepSeek считает текущий прогресс в разработке R2 недостаточным и планирует потратить дополнительное время на доведение модели до требуемого уровня. Тем не менее, некоторые источники ожидают скорого выхода обновленной версии языковой модели.
Ситуация с DeepSeek иллюстрирует сложности китайских технологических компаний в условиях американских санкций и попыток замещения зарубежных компонентов отечественными аналогами. Проблемы с производительностью локальных ускорителей могут затормозить развитие китайской ИИ-индустрии.