Grok подвергся «несанкционированной модификации» системного промпта

Пользователи платформы X зафиксировали многочисленные случаи генерации чат-ботом Grok нерелевантных сообщений, содержащих информацию о так называемом «белом геноциде» в Южной Африке, не соответствующих контексту исходных запросов.

Аномальные ответы генерировались даже при обращении к системе с вопросами, не имеющими отношения к южноафриканской тематике. Согласно официальному заявлению xAI, причиной такого функционирования системы стала «несанкционированная модификация» системного промпта модели – базового набора инструкций, определяющих общие параметры поведения нейросети.

Технические специалисты компании подтвердили, что изменения были внесены в среду утром и направлены на программирование Grok для предоставления «специфических ответов» на «политические темы».

Руководство xAI квалифицировало данные действия как нарушение «внутренней политики и ключевых ценностей» корпорации.

Принципиально важным аспектом данного инцидента является его рецидивный характер. В феврале 2025 года компания уже сталкивалась с аналогичным случаем несанкционированного вмешательства в алгоритмические инструкции Grok, когда нейросеть была запрограммирована на избирательную цензуру контента, связанного с Дональдом Трампом и основателем xAI Илоном Маском.

Тогда, по заявлению руководителя инженерного направления xAI Игоря Бабушкина, несанкционированные изменения также были внесены сотрудником компании и впоследствии устранены после выявления аномалий пользователями.

Автор: Юлия Самойлова
Пишет о технологиях искусственного интеллекта с 2019 года. Специализируется на материалах о практическом применении ИИ в различных отраслях.