Китайская модель GLM-4.7-Flash втрое обошла конкурентов

Китайская компания Z.ai выпустила GLM-4.7-Flash - облегченную версию флагманской модели. В ней 30 миллиардов параметров, но активны только 3 миллиарда. Несмотря на компактность, модель показывает впечатляющие результаты.

На бенчмарке SWE-bench Verified GLM-4.7-Flash набрала 59,2%. Для сравнения, Qwen3-30B-A3B-Thinking получила только 22%. Разница почти в три раза. Это открытая модель, веса доступны на Hugging Face.

Отрыв от конкурентов того же класса виден и в других тестах. На τ²-Bench для работы с инструментами - 79,5% против 49% у Qwen. На BrowseComp - 42,8% против 22,9%.

В математике Flash держится на уровне более крупных моделей. На AIME 2025 она показала 91,6%. Это практически наравне с GPT-OSS-20B.

Пользователи в X уже тестируют локальный запуск. На M3 Ultra в 4-bit квантизации модель выдает свыше 80 токенов в секунду. На ноутбучных M5 - от 40 до 50 токенов в секунду.

Поддержка появилась в MLX, vLLM и SGLang. API доступен бесплатно с одним параллельным запросом. Есть платная версия с высокой пропускной способностью.

Для Z.ai это первый крупный релиз после IPO на Гонконгской бирже 8 января. Компания остается в санкционном списке США. Но она продолжает выпускать открытые модели, которые конкурируют с западными аналогами.

Успех GLM-4.7-Flash показывает эффективность подхода с частичной активацией параметров. Вместо того чтобы задействовать все 30 миллиардов, модель использует только нужные 3 миллиарда для каждой задачи. Это дает скорость и экономию ресурсов без потери качества.

Возможность запуска на потребительском железе делает модель доступной широкой аудитории. Разработчики могут экспериментировать локально без необходимости в мощных серверах или облачных сервисах.

Открытые веса - еще один плюс. Сообщество может адаптировать модель под свои задачи, файнтюнить и изучать ее работу. Это ускоряет внедрение и развитие технологии.

Результаты на бенчмарках говорят сами за себя. Троекратное превосходство над Qwen на SWE-bench - это не просто улучшение. Это качественный скачок в классе компактных моделей.

Z.ai доказывает, что санкции не останавливают технологический прогресс. Компания продолжает создавать конкурентные продукты и делится ими с мировым сообществом. GLM-4.7-Flash - яркий пример этого подхода.