На мероприятии Spring Launch 2025, компания представила новые языковые модели, инструменты и инфраструктурные обновления. «Мы запускаем серию обновлений платформы PaaS (Platform-as-a-Service) и возможностей ИИ, чтобы удовлетворить растущий спрос на цифровую трансформацию со всего мира.», — заявила Селина Юань, президент международного бизнес-подразделения Alibaba Cloud Intelligence.
Компания предоставила доступ к последним версиям своей фирменной серии больших языковых моделей (LLM) Qwen, включая крупномасштабную модель Mixture of Experts (MoE) Qwen-Max, модель рассуждений QwQ-Plus, модель визуальных рассуждений QVQ-Max и комплексную мультимодальную модель Qwen2.5-Omni-7b.
QwQ-Plus представляет собой продвинутую модель рассуждений, специализирующуюся на глубоком аналитическом мышлении и решении сложных задач, таких как экспертные математические проблемы, с помощью алгоритмически обоснованных решений. В свою очередь, QVQ-Max — это модель визуальных рассуждений, которая эффективно решает комплексные мультимодальные задачи с высокой точностью и расширенными возможностями логического анализа, поддерживая визуальный ввод и пошаговый вывод рассуждений.
Для поддержки этих AI-моделей на уровне PaaS, платформа Alibaba Cloud Platform for AI (PAI) получила существенные улучшения. PAI-Elastic Algorithm Service (EAS) теперь обладает возможностями распределенного вывода с мультинодовой архитектурой, что позволяет удовлетворить растущие потребности сверхбольших моделей, особенно использующих структуру MoE и обработку сверхдлинных текстов, преодолевая ограничения традиционной однонодовой архитектуры.
Для дальнейшего повышения производительности и снижения затрат PAI-EAS представил функцию prefill-decode disaggregation, которая обеспечила 92% увеличение параллельной обработки и 91% рост количества токенов в секунду (TPS) при развертывании с моделью Qwen2.5-72B, значительно улучшая масштабируемость и эффективность.
PAI-Model Gallery был обновлен и теперь предлагает обширную коллекцию из почти 300 передовых моделей с открытым исходным кодом, включая полный спектр фирменных моделей Alibaba Cloud — серии Qwen и Wan. Все они доступны через интуитивно понятный интерфейс без необходимости программирования для развертывания и управления. Платформа предлагает различные методы развертывания с базовыми вычислительными ресурсами, а также новые функции, такие как оценка производительности моделей и дистилляция моделей, которая снижает затраты на развертывание путем передачи знаний от больших моделей к малым.
Компания также интегрировала свое хранилище данных AnalyticDB в Model Studio, платформу Alibaba Cloud для разработки генеративных ИИ-моделей и приложений, в качестве рекомендуемой векторной базы данных для RAG-решений. Это улучшение напрямую связывает корпоративные базы знаний организаций с ИИ-моделями и инструментами, доступными на Model Studio, упрощая разработку приложений, учитывающих контекст.