Китайская компания Z.ai выпустила GLM-4.7-Flash — облегченную версию флагманской модели. В ней 30 миллиардов параметров, но активны только 3 миллиарда. Несмотря на компактность, модель показывает впечатляющие результаты.
На бенчмарке SWE-bench Verified GLM-4.7-Flash набрала 59,2%. Для сравнения, Qwen3-30B-A3B-Thinking получила только 22%. Разница почти в три раза. Это открытая модель, веса доступны на Hugging Face.
Узнать подробнее про клуб ShareAI
Отрыв от конкурентов того же класса виден и в других тестах. На τ²-Bench для работы с инструментами — 79,5% против 49% у Qwen. На BrowseComp — 42,8% против 22,9%.
В математике Flash держится на уровне более крупных моделей. На AIME 2025 она показала 91,6%. Это практически наравне с GPT-OSS-20B.
Пользователи в X уже тестируют локальный запуск. На M3 Ultra в 4-bit квантизации модель выдает свыше 80 токенов в секунду. На ноутбучных M5 — от 40 до 50 токенов в секунду.
Поддержка появилась в MLX, vLLM и SGLang. API доступен бесплатно с одним параллельным запросом. Есть платная версия с высокой пропускной способностью.
Для Z.ai это первый крупный релиз после IPO на Гонконгской бирже 8 января. Компания остается в санкционном списке США. Но она продолжает выпускать открытые модели, которые конкурируют с западными аналогами.
Успех GLM-4.7-Flash показывает эффективность подхода с частичной активацией параметров. Вместо того чтобы задействовать все 30 миллиардов, модель использует только нужные 3 миллиарда для каждой задачи. Это дает скорость и экономию ресурсов без потери качества.
Возможность запуска на потребительском железе делает модель доступной широкой аудитории. Разработчики могут экспериментировать локально без необходимости в мощных серверах или облачных сервисах.
Открытые веса — еще один плюс. Сообщество может адаптировать модель под свои задачи, файнтюнить и изучать ее работу. Это ускоряет внедрение и развитие технологии.
Результаты на бенчмарках говорят сами за себя. Троекратное превосходство над Qwen на SWE-bench — это не просто улучшение. Это качественный скачок в классе компактных моделей.
Z.ai доказывает, что санкции не останавливают технологический прогресс. Компания продолжает создавать конкурентные продукты и делится ими с мировым сообществом. GLM-4.7-Flash — яркий пример этого подхода.

