Baidu представила языковую модель Ernie 5.1 — и главная новость здесь не производительность, а цена. По данным компании, предобучение обошлось всего в 6% от того, что тратят конкуренты на сопоставимые модели.
При этом Ernie 5.1 занимает 4-е место в мировом рейтинге Search Arena Leaderboard с 1223 очками — позади двух версий Claude Opus и GPT-5.5 Search. Среди китайских моделей — первая.
Как получилось сэкономить 94%
Секрет в том, что Ernie 5.1 не обучалась с нуля. Baidu разработала подход под названием Once-For-All («один раз для всех»): вместо отдельных дорогостоящих прогонов для каждого размера модели компания обучает целое семейство моделей за один проход. Разные конфигурации — по глубине, ширине и числу активных блоков — получаются из одного обучения.
Ernie 5.1 извлечена из этого семейства как уменьшенная версия Ernie 5.0: параметров примерно втрое меньше, активных при обработке запроса — вдвое. Тяжёлые вычисления уже были сделаны для предшественника, поэтому новая модель обошлась дёшево.
Что умеет модель
В агентных задачах (tau3-bench, SpreadsheetBench) Ernie 5.1 превосходит DeepSeek-V4-Pro. На математическом бенчмарке AIME26 с доступом к инструментам уступает только Gemini 3.1 Pro. На Text Arena — 13-е место с 1476 очками.
Для пост-обучения Baidu применила четырёхэтапный конвейер, который решает известную проблему: когда модель тренируют на нескольких навыках одновременно, улучшение одного часто ухудшает другой. Сначала общее обучение, потом параллельная тренировка специализированных «учителей» по коду, логике и агентным задачам, затем дистилляция в одну модель, и наконец — обучение с подкреплением для диалога и творческих задач.
Доступность
Модель работает на ernie.baidu.com и в Baidu AI Studio. Веса не публикуются — проверить заявленные цифры независимо невозможно.