Китайская компания Moonshot AI представила новую большую языковую модель с открытым исходным кодом Kimi-K2, которая демонстрирует производительность на уровне ведущих проприетарных решений. Многие специалисты оценивают это как важный этап в развитии ИИ в Китае после выпуска Deepseek.
Основанная в 2023 году Moonshot AI создала модель, объединяющую экспертный опыт и масштабную архитектуру с одним трлн параметров, из которых 32 млрд активируются при выводе данных. Открытые весовые коэффициенты делают Kimi-K2 доступной для научных исследований, тонкой настройки и специализированного применения в различных областях.
Согласно результатам стандартных тестов, версия Kimi-K2-Instruct, оптимизированная для практического использования, находится в одном ряду с ведущими закрытыми моделями.
В тесте SWE-bench Verified, оценивающем способность выявлять и исправлять реальные ошибки в проектах с открытым исходным кодом, модель набрала 65,8% в режиме агента. Этот результат уступает только Claude Sonnet 4, но значительно превосходит показатель GPT-4.1 (54,6%).
Kimi-K2 также демонстрирует лидирующие позиции в LiveCodeBench (53,7%) и OJBench (27,1%) без использования специального модуля логического вывода.
Эти бенчмарки оценивают эффективность языковых моделей при решении задач программирования: LiveCodeBench — в интерактивном режиме, OJBench — в формате традиционных соревновательных заданий.
Помимо превосходства в области программирования, Kimi-K2 показывает высокие результаты в задачах по математике и естественным наукам.
В таких тестах как AIME, GPQA-Diamond и MATH-500 модель превосходит конкурирующие решения. Китайская разработка также входит в число лучших в многоязычных тестах, включая MMLU-Pro, что подтверждает ее универсальность.