Компания Midjourney объявила о запуске своей модели генерации видеоконтента — модели V1, разработка которой заняла почти 2 года. Данное решение стало доступно всем подписчикам сервиса, начиная с базового тарифа стоимостью 10 долларов.
По словам генерального директора Midjourney Дэвида Хольца, представленная видеомодель является промежуточным этапом на пути к основной цели компании — разработке ИИ-моделей, «способных к симуляции открытого мира в реальном времени».
Техническая спецификация первой версии видеомодели имеет ряд ограничений: разрешение выходного материала составляет 480p, а продолжительность генерируемых фрагментов не превышает 5 секунд. Данные параметры, вероятно, связаны с необходимостью оптимизации нагрузки на серверную инфраструктуру на начальном этапе развертывания сервиса.
При этом пользователям предоставлена возможность последовательной генерации дополнительных видеосегментов.
Процесс взаимодействия с видеомоделью реализован по аналогии с генерацией изображений — система выдает четыре варианта видеофрагментов на один текстовый запрос. Несмотря на высокое визуальное качество и отсутствие заметных артефактов, текущая версия не обеспечивает полноценной симуляции реальной физики и комплексных динамических сцен.
Длительный период разработки видеомодели объясняется высокой вычислительной сложностью и финансовыми затратами на создание технологий генерации видеоконтента. Принципиальным фактором также является бизнес-модель Midjourney, которая финансирует разработку исключительно за счет собственной выручки, не привлекая внешние инвестиции.
Дорожная карта технологического развития Midjourney предполагает последующую разработку ИИ-моделей для создания трехмерных визуализаций, а также систем, функционирующих в режиме реального времени.
Запуск видеомодели V1 происходит на фоне обострения юридических противоречий с правообладателями. Всего неделю назад компания Midjourney стала объектом судебного иска со стороны двух крупнейших голливудских киностудий — Disney и Universal. Предметом правового спора стали изображения, сгенерированные ИИ-моделями Midjourney, которые, по утверждению истцов, воспроизводят защищенных авторским правом персонажей, включая Гомера Симпсона и Дарта Вейдера.