Активность ИИ-ботов на российских сайтах выросла втрое

По данным исследования, опубликованного «Ведомостями», количество посещений российских веб-ресурсов автономными ИИ-системами выросло в три раза, достигнув 3 млн визитов в первом полугодии 2025 года.

Лидерами среди ИИ-систем автоматического сбора данных стали GPTBot (разработка OpenAI), Google-Extended и ClaudeBot (создан компанией Anthropic). В пятерку наиболее активных краулеров также вошли DeepSeekBot и YandexBot.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Исследование, базирующееся на анализе более 10 млн посещений российских цифровых площадок, охватило различные рыночные сегменты: электронную коммерцию, финансовый сектор, образовательные платформы и другие отрасли. Это позволило выявить специфику роста ИИ-трафика в разных секторах экономики.

В первой половине 2024 года объем визитов от чат-ботов составлял около 1 млн, что подтверждает трехкратный рост показателя за год. Данная динамика свидетельствует о существенном изменении в методах сбора и обработки информации в цифровой среде.

Технологические особенности современных ИИ-краулеров заключаются в их расширенных возможностях: они анализируют текстовый контент, распознают изображения и видеоматериалы, обрабатывают другие типы цифрового содержания. Полученные данные используются для обучения крупных языковых моделей, что повышает качество и точность их работы.

Наиболее высокие темпы роста ИИ-трафика зафиксированы в сегменте электронной коммерции — 170%. Значительное увеличение также наблюдается в сферах онлайн-образования (120%) и туристических сервисов (110%). Для банковских и медиаресурсов характерен более сдержанный, но все же существенный прирост на уровне 80%.

Автор: Александр Чернов
Журналист с техническим бэкграундом, пишущий о практических аспектах внедрения искусственного интеллекта. Бывший главред федерального издания. Любит сбалансированную подачу информации без хайпа.