Stability AI научилась превращать фото в 3D-сцены с помощью нового ИИ

Компания Stability AI представила новую модель Stable Virtual Camera, способную преобразовывать двумерные изображения в “иммерсивные” видео с реалистичной глубиной и перспективой. Модель способна создавать “новые ракурсы” сцены из одного или нескольких изображений (до 32 в общей сложности) под заданными пользователем углами камеры.

Система может генерировать видео, перемещающиеся по “динамическим” траекториям камеры или использующие предустановленные шаблоны, включая “Спираль”, “Зум Долли”, “Движение” и “Панорамирование”. Текущая исследовательская версия Stable Virtual Camera может создавать видео в форматах квадрат (1:1), портрет (9:16) и ландшафт (16:9) длиной до 1000 кадров.

Однако компания предупреждает, что модель может выдавать результаты более низкого качества в определенных сценариях, особенно при работе с изображениями, содержащими людей, животных или “динамические текстуры”, такие как вода.

Виртуальные камеры, традиционно используемые в цифровом кинопроизводстве и 3D-анимации для захвата и навигации по сценам в реальном времени, получили новое развитие. По заявлению компании, Stable Virtual Camera добавляет к этим инструментам возможности генеративного ИИ для обеспечения большего контроля и кастомизации.

“Сильно неоднозначные сцены, сложные траектории камеры, пересекающие объекты или поверхности, и объекты неправильной формы могут вызывать мерцающие артефакты”, – отмечает Stability в своем блоге, “особенно когда целевые ракурсы значительно отличаются от исходных изображений”.