Китайская GLM-5.1 обошла GPT-5.4 и Claude в ряде тестов — и теперь доступна бесплатно

Китайская компания Z.ai выпустила открытую языковую модель GLM-5.1. По заявлению разработчиков, это лучшая открытая модель в мире — и третья по силе среди всех существующих.

В нескольких бенчмарках по написанию кода GLM-5.1 превзошла GPT-5.4 и Claude Opus 4.6. Среди открытых моделей она обошла MiniMax M2.7 и Kimi K2.5. Из закрытых конкурентов позади осталась Gemini 3.1 Pro. Результаты замерялись на SWE-Bench Pro, Terminal-Bench и NL2Repo — стандартных тестах для оценки агентских возможностей.

Главная фишка GLM-5.1 — работа с длинными задачами. Большинство моделей упираются в потолок после первых нескольких попыток. GLM-5.1 проектировалась иначе: чем дольше она работает, тем лучше результат. Модель способна автономно трудиться до восьми часов, последовательно улучшая своё решение.

Тест на оптимизацию GPU-ядер наглядно это показывает. Предыдущая GLM-5 и Claude Opus 4.5 выходили на плато примерно через 200 итераций. GLM-5.1 продолжала улучшать результат вплоть до 1200-й попытки. Правда, в этом же тесте Claude Opus 4.6 в итоге показала более высокий финальный результат.

Для демонстрации возможностей модели разработчики поставили ей нетривиальную задачу: создать веб-приложение, имитирующее Linux-десктоп с 50 программами. Через час GLM-5.1 сделала каркас интерфейса. Через два — панель задач и окна. К четвёртому часу появился браузер, к пятому — мессенджер. Все 50 приложений были готовы через восемь часов.

Модель доступна бесплатно как открытый проект. Z.ai — компания из Китая, стоящая за серией GLM-моделей, разрабатываемых совместно с исследовательской лабораторией Университета Цинхуа.