Stability AI научилась превращать фото в 3D-сцены с помощью нового ИИ

Компания Stability AI представила новую модель Stable Virtual Camera, способную преобразовывать двумерные изображения в «иммерсивные» видео с реалистичной глубиной и перспективой. Модель способна создавать «новые ракурсы» сцены из одного или нескольких изображений (до 32 в общей сложности) под заданными пользователем углами камеры.

Система может генерировать видео, перемещающиеся по «динамическим» траекториям камеры или использующие предустановленные шаблоны, включая «Спираль», «Зум Долли», «Движение» и «Панорамирование». Текущая исследовательская версия Stable Virtual Camera может создавать видео в форматах квадрат (1:1), портрет (9:16) и ландшафт (16:9) длиной до 1000 кадров.

Однако компания предупреждает, что модель может выдавать результаты более низкого качества в определенных сценариях, особенно при работе с изображениями, содержащими людей, животных или «динамические текстуры», такие как вода.

Виртуальные камеры, традиционно используемые в цифровом кинопроизводстве и 3D-анимации для захвата и навигации по сценам в реальном времени, получили новое развитие. По заявлению компании, Stable Virtual Camera добавляет к этим инструментам возможности генеративного ИИ для обеспечения большего контроля и кастомизации.

«Сильно неоднозначные сцены, сложные траектории камеры, пересекающие объекты или поверхности, и объекты неправильной формы могут вызывать мерцающие артефакты», – отмечает Stability в своем блоге, «особенно когда целевые ракурсы значительно отличаются от исходных изображений».

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.