Qwen выпускает ИИ-модель, превосходящую Mistral-Small и Gemma

Команда Qwen объявила о выпуске новой мультимодальной модели с открытым исходным кодом — Qwen2.5-VL-32B-Instruct. Новая модель, лицензированная под Apache 2.0, построена на базе серии Qwen2.5-VL, выпущенной в конце января этого года. По заявлению разработчиков, модель прошла дополнительную оптимизацию с использованием обучения с подкреплением, что значительно улучшило ее возможности.

Ключевые особенности Qwen2.5-VL-32B-Instruct включают ответы, более соответствующие предпочтениям человека, с улучшенным форматированием и детализацией. Модель демонстрирует значительное улучшение точности при решении сложных математических задач, а также повышенную точность анализа изображений, распознавания контента и визуальной логической дедукции.

Впечатляющим достижением стало то, что при масштабном тестировании Qwen2.5-VL-32B-Instruct продемонстрировала превосходство над моделями сопоставимого размера, такими как Mistral-Small-3.1-24B и Gemma-3-27B-IT. Более того, 32-миллиардная модель даже превзошла показатели своей более крупной предшественницы — Qwen2-VL-72B-Instruct.

Особенно значительные преимущества были достигнуты в мультимодальных задачах, включая MMMU, MMMU-Pro и MathVista, которые фокусируются на сложных многоэтапных рассуждениях. В бенчмарке MM-MT-Bench, оценивающем субъективный пользовательский опыт, Qwen2.5-VL-32B-Instruct значительно опередила Qwen2-VL-72B-Instruct.

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.