Исследование компании Lasso показало, что ИИ-ассистент Microsoft Copilot продолжает хранить и предоставлять доступ к данным из более чем 20 000 репозиториев GitHub, которые были сделаны приватными или удалены. Проблема затрагивает даже таких ИТ-гигантов, как Google, IBM, PayPal, Tencent и Microsoft. По данным исследователей, даже кратковременное размещение репозитория в публичном доступе может привести к долгосрочным последствиям для безопасности данных.
«В Copilot, что удивительно, мы обнаружили один из наших собственных приватных репозиториев», – рассказал сооснователь Lasso Офир Дрор в интервью TechCrunch. «Если искать эти данные в интернете, их не найти. Но любой человек в мире может задать Copilot правильный вопрос и получить эту информацию».
Механизм утечки связан с системой кэширования поисковика Bing от Microsoft. Исследователи обнаружили, что когда репозиторий становится публичным даже на короткое время, данные индексируются и сохраняются в кэше Bing, после чего становятся доступными через Copilot, даже если репозиторий впоследствии закрывается или удаляется.
Для подтверждения масштаба проблемы Lasso проанализировала список репозиториев, которые были публичными в какой-либо момент 2024 года, а затем стали приватными или были удалены. Используя механизм кэширования Bing, исследователи смогли подтвердить сохранение доступа к конфиденциальным данным через Copilot.
Это открытие поднимает серьезные вопросы о безопасности данных в эпоху генеративного ИИ. Даже кратковременное появление информации в публичном доступе может привести к долгосрочному сохранению этих данных в системах искусственного интеллекта, что создает новые риски для кибербезопасности организаций.