Китайская модель Qwen 3 обновилась и обошла Claude 4 Opus и DeepSeek V3

Разработчики языковой модели Qwen представили обновленную версию своего флагманского продукта - Qwen 3-235B, которая по результатам независимых тестов превзошла лидирующие решения рынка, включая Claude 4 Opus и Kimi K2, а также DeepSeek V3.

Согласно техническим данным, Qwen 3-235B получила значительные улучшения в таких критических аспектах, как охват базовых знаний, общие интеллектуальные способности и точность следования предпочтениям пользователя. Модель эффективно справляется с пониманием сложных инструкций, демонстрирует высокий уровень логического вывода и обрабатывает расширенные контексты объемом до 256 тысяч токенов.

Важной особенностью релиза является фокус на инструктивном режиме (Instruct) работы модели. Команда Qwen приняла стратегическое решение о разделении функциональности - модель для рассуждений (reasoner) будет выпущена отдельным продуктом позднее.

Это обусловлено техническими сложностями объединения двух режимов в единой архитектуре, что, по заявлению разработчиков, негативно влияет на общую производительность системы.

Несмотря на принятое решение о разделении функциональности, команда Qwen продолжает исследования в области создания гибридных моделей-рассуждателей. На данном этапе выпущена только полноразмерная модель, но в соответствии с принятыми в индустрии подходами, ожидается, что в ближайшее время будет проведена дистилляция технологии в модели меньшего размера.