Alibaba выпустила 8 новых ИИ-моделей с гибридным мышлением

Alibaba только что представила Qwen3 — новое поколение своих ИИ-моделей с открытым исходным кодом. Семейство Qwen3 включает сразу восемь моделей — 6 плотных и 2 MoE-модели (Mixture-of-Experts). Все модели уже доступны через платформы Hugging Face и GitHub.

Размеры моделей варьируются от компактных 0,6 млрд параметров до впечатляющих 235 млрд параметров.  Qwen3 может плавно переключаться между «режимом мышления» для сложных многоэтапных задач, таких как математика, программирование и логические выводы, и «режимом без мышления» для быстрых, универсальных ответов.

Разработчики, использующие Qwen3 через API, получают контроль над длительностью «мышления» (до 38 тысяч токенов), что позволяет оптимально балансировать между интеллектуальной производительностью и вычислительной эффективностью.

Обученные на массивном наборе данных из 36 триллионов токенов — вдвое больше, чем у предшественника Qwen2.5 — новые модели демонстрируют значительный прогресс в рассуждениях, следовании инструкциям, использовании инструментов и многоязычных задачах.

Среди ключевых возможностей — поддержка 119 языков и диалектов с лидирующими показателями в переводе и многоязычном выполнении инструкций. Модели также нативно поддерживают протокол Model Context Protocol (MCP) и надежный вызов функций, превосходя другие модели с открытым исходным кодом в сложных агентских задачах.

По словам команды Qwen, «мы бесшовно интегрировали режимы мышления и не-мышления, предлагая пользователям гибкость в контроле над бюджетом мышления. Эта конструкция позволяет пользователям с большей легкостью настраивать бюджеты для конкретных задач».

Результаты тестирования показывают, что крупнейшая модель Qwen3-235B-A22B незначительно превосходит OpenAI o3-mini и Google Gemini 2.5 Pro на платформе Codeforces для программирования. Она также превосходит o3-mini в последней версии AIME — сложного математического теста, и BFCL — теста для оценки способности модели «рассуждать» о проблемах.

Появление таких моделей, как Qwen, усилило давление на американские лаборатории вроде OpenAI, заставляя их разрабатывать все более мощные технологии ИИ. Это также привело к тому, что политики США ввели ограничения, направленные на ограничение возможности китайских ИИ-компаний получать чипы, необходимые для обучения таких моделей.

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.