Microsoft представила rStar-Math — революционную технологию рассуждений. Которая позволяет небольшим языковым моделям (SLM) превзойти в решении математических задач даже передовую модель OpenAI o1-preview.
Исследователи из Microsoft, Пекинского университета и университета Цинхуа протестировали технологию на нескольких компактных моделях: Microsoft Phi-3 mini, Alibaba Qwen-1.5B (1,5 млрд параметров) и Qwen-7B (7 млрд параметров).
Результаты впечатляют — все модели показали улучшенную производительность в тесте MATH, включающем 12 500 задач по геометрии, алгебре и другим разделам математики различной сложности.
Хотя проект пока находится на исследовательской стадии, команда планирует опубликовать код и данные на Github. Как отметила один из авторов исследования Ли Лина Чжан, сейчас проект проходит внутреннюю проверку перед публичным релизом.
Сообщество разработчиков уже высоко оценило инновацию, особенно отметив сочетание метода поиска по дереву Монте-Карло с пошаговыми рассуждениями. Эксперты также обсуждают потенциальное применение технологии для геометрических доказательств и символьных вычислений.
Это достижение следует за недавним открытием исходного кода модели Phi-4 — 14-миллиардной ИИ-системы Microsoft, теперь доступной на Hugging Face под лицензией MIT.
Технология rStar-Math демонстрирует, что даже компактные модели могут достигать выдающихся результатов в математических рассуждениях.