Midjourney запускает конструктор виртуальных вселенных и миров

Инновационный инструмент вышел под названием «Patchwork». Компания Midjourney, известная своим ИИ-генератором изображений с более чем 21 млн пользователей только на Discord-сервере, представила принципиально новый подход к созданию виртуальных миров с помощью ИИ,. И он полностью меняет представление о коллективном творчестве.

Макс Креминский, руководитель Storytelling Lab в Midjourney, провел захватывающую демонстрацию Patchwork в прямом эфире через Discord и X (бывший Twitter).

Инструмент представляет собой бесконечный белый холст в веб-интерфейсе с продвинутой панелью инструментов слева. В арсенале создателя целый набор кнопок: «character» (персонаж), «event» (событие), «faction» (фракция), «place» (место), «prop» (реквизит), «random» (случайно), а также «note» (заметка), «image» (изображение), «portal» (портал), «save» (сохранить) и «share» (поделиться).

Для создания нового мира пользователь вводит текстовый запрос в редактор в верхней части экрана и выбирает один или несколько из 10 доступных стилей изображения. После этого генерируется новая доска с набором статичных изображений и текстовых блоков, называемых «scraps» (обрывки). В ходе демонстрации система автоматически создала персонажа по имени Marcus «Dizzy» Gillespie, отсылая к известному джазовому музыканту.

Особенность Patchwork заключается в возможности совместной работы в реальном времени – на одном холсте могут одновременно работать до 100 пользователей, хотя Креминский предупреждает, что чем больше участников, тем более хаотичным становится процесс.

Каждый созданный мир сохраняется в формате JSON-файла, содержащего ссылки на все сгенерированные изображения. Переключение между мирами осуществляется через «порталы» – специальные черные круглые кнопки.

Пользователи могут создавать связи между персонажами, прописывать последовательности действий и описания сцен для построения сюжета. Каждый персонаж может использоваться в нескольких изображениях, которые можно собрать воедино одним кликом. На данный момент просмотр досок доступен только авторизованным пользователям, но в будущем планируется открыть доступ и для гостей.

За работу приложения отвечают как минимум 3 различные языковые модели, включая уникальную fine-tuned модель Midjourney на основе открытого исходного кода. Креминский отметил, что инструмент уже активно используется группами настольных ролевых игр для планирования своих кампаний.

Ожидается, что следующая версия Midjourney (V7) получит функцию сохранения согласованности персонажей при генерации различных и новых изображений. В долгосрочной перспективе команда планирует развивать Patchwork в сторону создания полностью иммерсивных 3D-миров в виртуальной реальности.

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.