По данным издания The Information, компания OpenAI работает над новым инструментом, который сможет генерировать музыку на основе текстовых и аудиозапросов. Эта разработка может стать очередным важным шагом в развитии генеративного искусственного интеллекта компании, дополнив текстовые и визуальные возможности существующих продуктов.
Согласно источникам, такой инструмент можно будет использовать для добавления музыкального сопровождения к существующим видео или для создания гитарного аккомпанемента к вокальной дорожке. Это значительно упростит работу создателей контента, которым больше не придется искать готовую музыку или заказывать ее написание у профессионалов.
Узнать подробнее про клуб ShareAI
Пока неизвестно, когда OpenAI планирует запустить этот инструмент и будет ли он доступен как отдельный продукт или интегрирован в существующие сервисы компании, такие как ChatGPT и видеоприложение Sora. Эксперты отмечают, что интеграция в существующие продукты выглядит наиболее логичным шагом, особенно в контексте недавнего выпуска генератора видео Sora, который мог бы выиграть от возможности автоматически добавлять музыкальное сопровождение.
Один из источников рассказал The Information, что OpenAI сотрудничает с некоторыми студентами из Джульярдской школы — престижного музыкального учебного заведения в Нью-Йорке. Студенты помогают аннотировать музыкальные партитуры, что используется в качестве обучающих данных для создания модели. Такой подход к сбору данных показывает, что компания стремится обеспечить высокое качество обучающего материала, привлекая к работе специалистов из ведущего музыкального института.
Стоит отметить, что OpenAI уже выпускала генеративные музыкальные модели в прошлом, но это было до запуска ChatGPT. В 2020 году компания представила Jukebox — модель, которая могла создавать музыку в различных жанрах и даже имитировать вокал конкретных исполнителей. Однако с тех пор OpenAI переключила фокус и в последнее время больше работала над аудиомоделями для преобразования текста в речь и речи в текст.
Возвращение к разработке музыкальных инструментов может быть связано с растущей конкуренцией на рынке генеративного ИИ. На рынке генеративных музыкальных инструментов уже присутствуют другие крупные компании, включая Google и Suno, которые активно развивают технологии создания музыки с помощью искусственного интеллекта.
Особенно заметным игроком является Suno, который уже выпустил инструмент для создания полноценных музыкальных треков по текстовому описанию. Google также представила свои музыкальные модели MusicLM и Dream Track, которые могут создавать оригинальные композиции на основе текстовых подсказок.
Появление подобного инструмента от OpenAI может существенно повлиять на музыкальную индустрию, открывая новые возможности для творчества и одновременно поднимая вопросы об авторских правах и оригинальности в эпоху генеративного искусственного интеллекта.

