Alibaba только что представила Qwen3 — новое поколение своих ИИ-моделей с открытым исходным кодом. Семейство Qwen3 включает сразу восемь моделей — 6 плотных и 2 MoE-модели (Mixture-of-Experts). Все модели уже доступны через платформы Hugging Face и GitHub.
Размеры моделей варьируются от компактных 0,6 млрд параметров до впечатляющих 235 млрд параметров. Qwen3 может плавно переключаться между «режимом мышления» для сложных многоэтапных задач, таких как математика, программирование и логические выводы, и «режимом без мышления» для быстрых, универсальных ответов.
Узнать подробнее про клуб ShareAI
Разработчики, использующие Qwen3 через API, получают контроль над длительностью «мышления» (до 38 тысяч токенов), что позволяет оптимально балансировать между интеллектуальной производительностью и вычислительной эффективностью.
Обученные на массивном наборе данных из 36 триллионов токенов — вдвое больше, чем у предшественника Qwen2.5 — новые модели демонстрируют значительный прогресс в рассуждениях, следовании инструкциям, использовании инструментов и многоязычных задачах.
Среди ключевых возможностей — поддержка 119 языков и диалектов с лидирующими показателями в переводе и многоязычном выполнении инструкций. Модели также нативно поддерживают протокол Model Context Protocol (MCP) и надежный вызов функций, превосходя другие модели с открытым исходным кодом в сложных агентских задачах.
По словам команды Qwen, «мы бесшовно интегрировали режимы мышления и не-мышления, предлагая пользователям гибкость в контроле над бюджетом мышления. Эта конструкция позволяет пользователям с большей легкостью настраивать бюджеты для конкретных задач».
Результаты тестирования показывают, что крупнейшая модель Qwen3-235B-A22B незначительно превосходит OpenAI o3-mini и Google Gemini 2.5 Pro на платформе Codeforces для программирования. Она также превосходит o3-mini в последней версии AIME — сложного математического теста, и BFCL — теста для оценки способности модели «рассуждать» о проблемах.
Появление таких моделей, как Qwen, усилило давление на американские лаборатории вроде OpenAI, заставляя их разрабатывать все более мощные технологии ИИ. Это также привело к тому, что политики США ввели ограничения, направленные на ограничение возможности китайских ИИ-компаний получать чипы, необходимые для обучения таких моделей.