Ведущие ИИ-модели давали конкретные инструкции по биотерроризму

Ведущие ИИ-модели давали конкретные инструкции по биотерроризму

Дэвид Релман, эксперт по биобезопасности из Стэнфордского университета, рассказал New York Times о том, что несколько месяцев назад получил от одного из передовых ИИ-чат-ботов детальные инструкции по созданию смертоносного патогена и его использованию в массовой атаке.

Релман был нанят неназванной ИИ-компанией для стресс-тестирования системы перед публичным запуском. Он отказался раскрыть ни название компании, ни конкретный патоген — из опасения, что это вдохновит кого-то повторить эксперимент.

По его словам, чат-бот не просто отвечал на вопросы. Он сам предлагал, как модифицировать патоген для максимального числа жертв, как не оставить следов и как сделать его устойчивым к лечению. «Он отвечал на вопросы, которые я даже не успел задать — с таким уровнем изощрённости, что это меня просто ужаснуло», — сказал Релман.

Компания внесла некоторые исправления после его отчёта, но эксперт счёл их недостаточными.

OpenAI и Anthropic отреагировали сдержанно. Алекс Сандерфорд, руководитель отдела безопасности Anthropic, заявил, что «между правдоподобным текстом и реальными инструкциями для действий — огромная разница». Представитель OpenAI добавил, что подобное тестирование не «значимо увеличивает возможности реального вреда».

Этот риск не ограничивается будущими моделями. По данным доклада RAND Corporation за 2025 год, финансируемой правительством США, передовые модели 2024 года уже «способны существенно содействовать разработке биологического оружия» — включая пошаговые руководства для людей без специального образования.

По оценке авторов доклада, масштабные биотеррористические события с участием ИИ по-прежнему маловероятны — однако мотивированным злоумышленникам теперь не нужно далеко искать необходимую информацию.

Александр Чернов
Александр Чернов

Журналист с техническим бэкграундом, пишущий о практических аспектах внедрения искусственного интеллекта. Бывший главред федерального издания. Любит сбалансированную подачу информации без хайпа.