20 000 приватных репозиториев GitHub оказались доступны через Copilot

Исследование компании Lasso показало, что ИИ-ассистент Microsoft Copilot продолжает хранить и предоставлять доступ к данным из более чем 20 000 репозиториев GitHub, которые были сделаны приватными или удалены. Проблема затрагивает даже таких ИТ-гигантов, как Google, IBM, PayPal, Tencent и Microsoft. По данным исследователей, даже кратковременное размещение репозитория в публичном доступе может привести к долгосрочным последствиям для безопасности данных.

«В Copilot, что удивительно, мы обнаружили один из наших собственных приватных репозиториев», – рассказал сооснователь Lasso Офир Дрор в интервью TechCrunch. «Если искать эти данные в интернете, их не найти. Но любой человек в мире может задать Copilot правильный вопрос и получить эту информацию».

Механизм утечки связан с системой кэширования поисковика Bing от Microsoft. Исследователи обнаружили, что когда репозиторий становится публичным даже на короткое время, данные индексируются и сохраняются в кэше Bing, после чего становятся доступными через Copilot, даже если репозиторий впоследствии закрывается или удаляется.

Для подтверждения масштаба проблемы Lasso проанализировала список репозиториев, которые были публичными в какой-либо момент 2024 года, а затем стали приватными или были удалены. Используя механизм кэширования Bing, исследователи смогли подтвердить сохранение доступа к конфиденциальным данным через Copilot.

Это открытие поднимает серьезные вопросы о безопасности данных в эпоху генеративного ИИ. Даже кратковременное появление информации в публичном доступе может привести к долгосрочному сохранению этих данных в системах искусственного интеллекта, что создает новые риски для кибербезопасности организаций.

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.