РКН потратит 2,27 миллиарда на ИИ для блокировки сайтов

Роскомнадзор планирует внедрить машинное обучение для фильтрации интернет-трафика в этом году. На проект выделят 2,27 миллиарда рублей. Об этом говорится в плане цифровизации РКН.

Эксперты считают, что РКН сможет эффективнее блокировать запрещенные ресурсы и ограничивать VPN-сервисы.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Сейчас трафик фильтруют технические средства противодействия угрозам. Они размещены на сетях операторов связи. С их помощью заблокировано более миллиона ресурсов. За день ТСПУ ограничивает доступ к 5500 новым адресам и доменам.

Источник, близкий к аппарату вице-премьера Дмитрия Григоренко, отмечает, что с 2025 года ведомства обязаны отчитываться по проектам с ИИ. РКН может хотеть находить запрещенный контент через машинное обучение и выявлять VPN-сервисы. Насколько это выполнимо и эффективно с финансовой точки зрения, не очевидно.

Партнер Comnews Research Леонид Коник считает, что машинное обучение позволит блокировать контент не по адресам, а по словам, выражениям или другим признакам. Владельцы заблокированных ресурсов создают копии с другими адресами, и новая система поможет находить их.

Бизнес-консультант Positive Technologies Алексей Лукацкий выделяет несколько вариантов применения. Выявление зашифрованного трафика и методов обхода блокировок. Обнаружение DDoS-атак и взаимодействия с командными серверами ботнетов. Классификация веб-приложений для поиска запрещенных мессенджеров. Отличие стриминга от скачивания для выявления пиратских ресурсов.

РКН уже использует ИИ для поиска запрещенной информации. Руководитель службы Андрей Липов говорил, что нейросети анализируют текст, аудио и видео. Время обнаружения запрещенной информации сократилось до шести часов против 48 часов в 2020 году.

Автоматизированная система РКН в сутки скачивает около 500 тысяч материалов. После анализа остается около 2000 материалов с нарушениями. Уже работают системы Окулус для поиска на видео и аудио, и Вепрь для поиска точек напряженности в соцсетях.

Но не все эксперименты удачны. В системе мониторинга персональных данных нейросети показали эффективность всего 60 процентов. Замруководителя РКН Милош Вагнер признал, что для повышения точности нужны огромные обучающие датасеты. Такие трудозатраты в условиях экономии средств сочли преждевременными.

Автор: Юлия Самойлова
Пишет о технологиях искусственного интеллекта с 2019 года. Специализируется на материалах о практическом применении ИИ в различных отраслях.