Baidu выпустила Ernie 5.1: топ-4 в мире за 6% от стандартных затрат на обучение

Baidu представила языковую модель Ernie 5.1 — и главная новость здесь не производительность, а цена. По данным компании, предобучение обошлось всего в 6% от того, что тратят конкуренты на сопоставимые модели.

При этом Ernie 5.1 занимает 4-е место в мировом рейтинге Search Arena Leaderboard с 1223 очками — позади двух версий Claude Opus и GPT-5.5 Search. Среди китайских моделей — первая.

Как получилось сэкономить 94%

Секрет в том, что Ernie 5.1 не обучалась с нуля. Baidu разработала подход под названием Once-For-All («один раз для всех»): вместо отдельных дорогостоящих прогонов для каждого размера модели компания обучает целое семейство моделей за один проход. Разные конфигурации — по глубине, ширине и числу активных блоков — получаются из одного обучения.

Ernie 5.1 извлечена из этого семейства как уменьшенная версия Ernie 5.0: параметров примерно втрое меньше, активных при обработке запроса — вдвое. Тяжёлые вычисления уже были сделаны для предшественника, поэтому новая модель обошлась дёшево.

Что умеет модель

В агентных задачах (tau3-bench, SpreadsheetBench) Ernie 5.1 превосходит DeepSeek-V4-Pro. На математическом бенчмарке AIME26 с доступом к инструментам уступает только Gemini 3.1 Pro. На Text Arena — 13-е место с 1476 очками.

Для пост-обучения Baidu применила четырёхэтапный конвейер, который решает известную проблему: когда модель тренируют на нескольких навыках одновременно, улучшение одного часто ухудшает другой. Сначала общее обучение, потом параллельная тренировка специализированных «учителей» по коду, логике и агентным задачам, затем дистилляция в одну модель, и наконец — обучение с подкреплением для диалога и творческих задач.

Доступность

Модель работает на ernie.baidu.com и в Baidu AI Studio. Веса не публикуются — проверить заявленные цифры независимо невозможно.