ByteDance запускает полнофункциональную генеративную платформу

ByteDance представила универсальную мультимодальную модель BAGEL, которая объединяет генерацию, редактирование и анализ текстового, визуального и видеоконтента в единой архитектурной структуре. Техническая архитектура базируется на подходе Mixture-of-Transformer-Experts (MoT), интегрирующем 7 млрд активных параметров в рамках общей конфигурации 14 млрд параметров.

Бенчмарковые показатели подтверждают конкурентоспособность платформы: 2388 баллов на MME и 0.88 на GenEval демонстрируют высокий уровень мультимодального понимания. Критическим достижением выступает реализация «интеллектуального» редактирования через Chain-of-Thought (CoT), обеспечивающая результаты, сопоставимые с Gemini 2.0 от Google.

Структурная оптимизация обеспечивает селективную активацию экспертных модулей для конкретных задач, что минимизирует вычислительные затраты при сохранении производительности специализированных решений.

Стратегическое значение инициативы выходит за рамки технологического позиционирования. Открытое распространение через HuggingFace и GitHub контрастирует с закрытыми коммерческими моделями конкурентов, потенциально катализируя формирование альтернативной экосистемы разработчиков. Подход отражает китайскую стратегию технологической экспансии через демократизацию передовых ИИ-решений

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.