Adobe добавляет ИИ-генерацию звука и речи в Firefly

Adobe представила новые ИИ-инструменты для работы со звуком, которые позволят автоматически добавлять тематическое фоновое сопровождение и закадровый голос в видеоролики. Функции Generate Soundtrack и Generate Speech будут интегрированы в обновленное приложение Adobe Firefly.

Инструмент Generate Soundtrack, уже доступный в публичной бета-версии, анализирует загруженное видео и создает до четырех вариантов инструментальных аудиодорожек длительностью до пяти минут. Система автоматически синхронизирует музыку с видеорядом.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Пользователи могут выбрать музыкальный стиль из готовых шаблонов (lofi, хип-хоп, классика и другие) или описать желаемое настроение в текстовом поле, например, «сентиментальное» или «агрессивное». ИИ также предложит примеры текстовых запросов на основе анализа содержания видео.

Параллельно запущена функция Generate Speech, позволяющая создавать озвучку по тексту. Инструмент предлагает более 50 голосов на базе модели Adobe Firefly Speech Model или технологии ElevenLabs и поддерживает свыше 20 языков. Пользователи могут настраивать скорость, высоту тона и эмоциональную окраску речи, а также корректировать произношение имен и слов с региональными особенностями.

Важное преимущество новых инструментов Adobe – отсутствие проблем с авторскими правами. По словам главы направления генеративного ИИ в Adobe Александру Костина, компания приобрела права на музыку и голоса у правообладателей. Это отличает Adobe от конкурентов вроде Suno и Udio, которые столкнулись с исками о нарушении авторских прав из-за обучения своих моделей на защищенных материалах.

Кроме того, Adobe разрабатывает веб-редактор Firefly Video Editor – многодорожечный редактор с временной шкалой для генерации, организации, обрезки и монтажа клипов. Он объединит инструменты для создания озвучки, саундтреков и титров в одном приложении с покадровым редактированием и стилевыми пресетами.

Редактор начнет поступать в бета-версию в следующем месяце. Для раннего доступа пользователям необходимо зарегистрироваться в листе ожидания.

Новые ИИ-инструменты Adobe существенно упрощают процесс создания профессионально звучащего контента, делая технологии озвучки доступными широкому кругу пользователей, от маркетологов и блогеров до профессиональных видеомейкеров.

MLTimes

медиа про ИИ, что происходит в мире ИИ. СМИ про ИИ.

Adobe добавляет ИИ-генерацию звука и речи в Firefly