Компания Mistral опубликовала в открытый доступ свою новую мультимодальную модель Mistral Small 3.1. Которая по многим параметрам превосходит решения от крупнейших технологических компаний, включая GPT-4o Mini от OpenAI, Claude 3.5 Haiku от Anthropic и Gemma 3 от Google. При этом модель демонстрирует впечатляющую скорость генерации — до 150 токенов в секунду.
Наиболее впечатляющей особенностью новой модели стало сочетание высокой производительности и компактного размера. Mistral Small 3.1 содержит всего 24 млрд параметров, что позволяет запускать её на доступном оборудовании — всего одной видеокарте NVIDIA RTX 4090. Или даже на компьютере Mac с 32 ГБ оперативной памяти.
«Сегодня мы анонсируем Mistral Small 3.1: лучшую модель в своем весовом классе. Основываясь на Mistral Small 3, эта новая модель обладает улучшенной текстовой производительностью, мультимодальным пониманием и расширенным контекстным окном до 128 тысяч токенов. Модель превосходит сопоставимые модели, такие как Gemma 3 и GPT-4o Mini, обеспечивая при этом скорость вывода 150 токенов в секунду», — заявили представители Mistral.
Одним из ключевых преимуществ Mistral Small 3.1 стала лицензия Apache 2.0, под которой выпущена модель. Это означает, что любой исследователь или разработчик может свободно использовать её как для научных целей, так и в коммерческих проектах.
Компания также опубликовала результаты бенчмарков, демонстрирующие превосходство новой модели над конкурентами в большинстве тестов. Помимо основной версии модели с инструкциями (instruct), Mistral также выпустила базовую версию для дальнейшей настройки исследователями.
«Современные ИИ-приложения требуют сочетания возможностей — обработки текста, понимания мультимодальных входных данных, поддержки нескольких языков и управления длинными контекстами — с низкой задержкой и экономической эффективностью. Как показано ниже, Mistral Small 3.1 — это первая модель с открытым исходным кодом, которая не только соответствует, но фактически превосходит производительность ведущих небольших проприетарных моделей по всем этим параметрам», — подчеркнули в Mistral.