Китайская MiniMax бросает вызов мировым лидерам ИИ с новой линейкой моделей

Китайский стартап MiniMax, поддерживаемый Alibaba и Tencent, представил три новые ИИ-модели. Способные конкурировать с разработками OpenAI и других американских компаний.

Компания, привлекшая около $850 млн инвестиций при оценке более $2,5 млрд, выпустила текстовую модель MiniMax-Text-01, мультимодальную MiniMax-VL-01 и генератор речи T2A-01-HD.

MiniMax-Text-01, содержащая 456 млрд параметров, по заявлениям компании превосходит недавно анонсированную Gemini 2.0 Flash от Google в тестах MMLU и SimpleQA, оценивающих способность решать математические задачи и отвечать на фактические вопросы.

Модель также обладает рекордным контекстным окном в 4 млн токенов, что в 31 раз больше, чем у GPT-4o и Llama 3.1.

MiniMax-VL-01 конкурирует с Claude 3.5 Sonnet в задачах мультимодального понимания, хотя и уступает Gemini 2.0 Flash и GPT-4o в некоторых тестах. T2A-01-HD может генерировать синтетические голоса на 17 языках и клонировать голос из 10-секундной записи.

Примечательно, что хотя модели доступны на GitHub и Hugging Face, они не являются полностью открытыми — компания не раскрывает данные для обучения и накладывает ограничения на использование.

MiniMax уже сталкивается с противоречиями: их приложение Talkie было удалено из App Store за неразрешенное использование образов знаменитостей, а китайский стриминговый сервис iQiyi подал в суд за нарушение авторских прав.

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.