Qwen выпускает ИИ-модель, превосходящую Mistral-Small и Gemma

Команда Qwen объявила о выпуске новой мультимодальной модели с открытым исходным кодом — Qwen2.5-VL-32B-Instruct. Новая модель, лицензированная под Apache 2.0, построена на базе серии Qwen2.5-VL, выпущенной в конце января этого года. По заявлению разработчиков, модель прошла дополнительную оптимизацию с использованием обучения с подкреплением, что значительно улучшило ее возможности.

Ключевые особенности Qwen2.5-VL-32B-Instruct включают ответы, более соответствующие предпочтениям человека, с улучшенным форматированием и детализацией. Модель демонстрирует значительное улучшение точности при решении сложных математических задач, а также повышенную точность анализа изображений, распознавания контента и визуальной логической дедукции.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Впечатляющим достижением стало то, что при масштабном тестировании Qwen2.5-VL-32B-Instruct продемонстрировала превосходство над моделями сопоставимого размера, такими как Mistral-Small-3.1-24B и Gemma-3-27B-IT. Более того, 32-миллиардная модель даже превзошла показатели своей более крупной предшественницы — Qwen2-VL-72B-Instruct.

Особенно значительные преимущества были достигнуты в мультимодальных задачах, включая MMMU, MMMU-Pro и MathVista, которые фокусируются на сложных многоэтапных рассуждениях. В бенчмарке MM-MT-Bench, оценивающем субъективный пользовательский опыт, Qwen2.5-VL-32B-Instruct значительно опередила Qwen2-VL-72B-Instruct.

MLTimes

медиа про ИИ, что происходит в мире ИИ. СМИ про ИИ.

Qwen выпускает ИИ-модель, превосходящую Mistral-Small и Gemma