Китайский стартап MiniMax, поддерживаемый Alibaba и Tencent, представил три новые ИИ-модели. Способные конкурировать с разработками OpenAI и других американских компаний.
Компания, привлекшая около $850 млн инвестиций при оценке более $2,5 млрд, выпустила текстовую модель MiniMax-Text-01, мультимодальную MiniMax-VL-01 и генератор речи T2A-01-HD.
MiniMax-Text-01, содержащая 456 млрд параметров, по заявлениям компании превосходит недавно анонсированную Gemini 2.0 Flash от Google в тестах MMLU и SimpleQA, оценивающих способность решать математические задачи и отвечать на фактические вопросы.
Модель также обладает рекордным контекстным окном в 4 млн токенов, что в 31 раз больше, чем у GPT-4o и Llama 3.1.
MiniMax-VL-01 конкурирует с Claude 3.5 Sonnet в задачах мультимодального понимания, хотя и уступает Gemini 2.0 Flash и GPT-4o в некоторых тестах. T2A-01-HD может генерировать синтетические голоса на 17 языках и клонировать голос из 10-секундной записи.
Примечательно, что хотя модели доступны на GitHub и Hugging Face, они не являются полностью открытыми — компания не раскрывает данные для обучения и накладывает ограничения на использование.
MiniMax уже сталкивается с противоречиями: их приложение Talkie было удалено из App Store за неразрешенное использование образов знаменитостей, а китайский стриминговый сервис iQiyi подал в суд за нарушение авторских прав.