Ученые из России открыли свободный доступ к технологии защиты голосовых данных от автоматического сбора и анализа. Разработка создана совместными усилиями специалистов из Института искусственного интеллекта (AIRI), Московского технического университета связи и информатики (МТУСИ), «Сбера» и компании VeinCV.
В основе технологии лежат универсальные состязательные патчи (UAP), которые встраиваются в аудиофайл перед его публикацией. Такой патч создает помехи для алгоритмов, собирающих и анализирующих голосовую биометрию человека, при этом практически не влияя на качество звука для слушателя.
Проблема защиты голосовых данных становится особенно актуальной с развитием технологий синтеза речи. Алгоритмы, собирающие голосовую биометрию, могут использоваться злоумышленниками для создания дипфейков, подделки идентификации или сбора личной информации без согласия человека.
Ключевое преимущество разработки — сохранение функциональности аудиозаписи при блокировке возможности идентификации голоса. Защищенные записи остаются понятными для восприятия и могут использоваться для транскрипции, перевода или поиска информации. При этом автоматические системы не смогут извлечь из них уникальные голосовые характеристики человека.
Технология работает с аудиофайлами любой продолжительности и может найти применение в различных сферах: для защиты контента публичных персон, обеспечения безопасности образовательных платформ, защиты записей вебинаров и конференций.
Научная ценность разработки подтверждена принятием исследования к публикации на международной конференции Interspeech 2025 в Роттердаме, входящей в престижный рейтинг Core-A. Полный текст исследования можно прочитать по ссылке https://arxiv.org/pdf/2505.19951