Wan2.1-FLF2V-14B позволяет создавать видеоролики на основе заданных начального и конечного кадров. Пользователи могут бесплатно создавать пятисекундные видео с разрешением 720p на официальном сайте Wan.
Новая модель является частью фундаментальной серии Wan2.1, специально разработанной для генерации высококачественных изображений и видео на основе текста и изображений. Технология уже доступна на популярных платформах Hugging Face и GitHub, а также на собственной платформе открытого кода Alibaba Cloud — ModelScope.
Модель демонстрирует впечатляющие возможности по выполнению инструкций пользователей, поддерживая идеальную согласованность между первым кадром и сгенерированным видео, а также обеспечивая плавные переходы между начальным и конечным кадрами для создания реалистичных визуализаций сложных движений.
В основе этой технологии лежит инновационный подход к генерации видео с использованием дополнительного механизма контроля. Этот механизм использует предоставленные пользователем первый и последний кадры последовательности в качестве управляющих условий, обеспечивая плавные и точные переходы между начальной и конечной точками.
Для обеспечения визуальной стабильности механизм внедряет семантические особенности первого и последнего кадров в процесс генерации, позволяя модели сохранять согласованность стиля, содержания и структуры при динамическом преобразовании кадров.
Alibaba Cloud, будучи одной из первых крупных мировых технологических компаний, открывших исходный код своих самостоятельно разработанных масштабных моделей ИИ, в феврале 2025 года сделала открытыми четыре модели Wan2.1. На сегодняшний день эти модели привлекли более 2,2 миллиона загрузок на платформах Hugging Face и ModelScope.
Представленная в начале этого года серия Wan2.1 стала первой моделью генерации видео с поддержкой текстовых эффектов как на китайском, так и на английском языках. Она возглавляет рейтинг VBench — комплексный набор показателей для моделей генерации видео.
Первая открытая крупная языковая модель (LLM) Alibaba Cloud — Qwen-7B — была выпущена в августе 2023 года. Открытые модели Qwen стабильно занимают верхние строчки в рейтингах Hugging Face Open LLM, демонстрируя производительность на уровне ведущих мировых моделей ИИ по различным показателям.
За последние годы Alibaba Cloud открыла исходный код более 200 генеративных моделей ИИ. На данный момент на базе семейства моделей Qwen на платформе Hugging Face разработано более 100 000 производных моделей, что делает его одним из самых значимых семейств моделей ИИ в мире.