Midjourney запускает генеративную видеомодель V1 на фоне исков от Disney

Компания Midjourney объявила о запуске своей модели генерации видеоконтента — модели V1, разработка которой заняла почти 2 года. Данное решение стало доступно всем подписчикам сервиса, начиная с базового тарифа стоимостью 10 долларов.

По словам генерального директора Midjourney Дэвида Хольца, представленная видеомодель является промежуточным этапом на пути к основной цели компании — разработке ИИ-моделей, «способных к симуляции открытого мира в реальном времени».

Техническая спецификация первой версии видеомодели имеет ряд ограничений: разрешение выходного материала составляет 480p, а продолжительность генерируемых фрагментов не превышает 5 секунд. Данные параметры, вероятно, связаны с необходимостью оптимизации нагрузки на серверную инфраструктуру на начальном этапе развертывания сервиса.

При этом пользователям предоставлена возможность последовательной генерации дополнительных видеосегментов.

Процесс взаимодействия с видеомоделью реализован по аналогии с генерацией изображений — система выдает четыре варианта видеофрагментов на один текстовый запрос. Несмотря на высокое визуальное качество и отсутствие заметных артефактов, текущая версия не обеспечивает полноценной симуляции реальной физики и комплексных динамических сцен.

Длительный период разработки видеомодели объясняется высокой вычислительной сложностью и финансовыми затратами на создание технологий генерации видеоконтента. Принципиальным фактором также является бизнес-модель Midjourney, которая финансирует разработку исключительно за счет собственной выручки, не привлекая внешние инвестиции.

Дорожная карта технологического развития Midjourney предполагает последующую разработку ИИ-моделей для создания трехмерных визуализаций, а также систем, функционирующих в режиме реального времени.

Запуск видеомодели V1 происходит на фоне обострения юридических противоречий с правообладателями. Всего неделю назад компания Midjourney стала объектом судебного иска со стороны двух крупнейших голливудских киностудий — Disney и Universal. Предметом правового спора стали изображения, сгенерированные ИИ-моделями Midjourney, которые, по утверждению истцов, воспроизводят защищенных авторским правом персонажей, включая Гомера Симпсона и Дарта Вейдера.

Автор: Александр Чернов
Журналист с техническим бэкграундом, пишущий о практических аспектах внедрения искусственного интеллекта. Бывший главред федерального издания. Любит сбалансированную подачу информации без хайпа.