Grok подвергся "несанкционированной модификации" системного промпта

Пользователи платформы X зафиксировали многочисленные случаи генерации чат-ботом Grok нерелевантных сообщений, содержащих информацию о так называемом “белом геноциде” в Южной Африке, не соответствующих контексту исходных запросов.

Аномальные ответы генерировались даже при обращении к системе с вопросами, не имеющими отношения к южноафриканской тематике. Согласно официальному заявлению xAI, причиной такого функционирования системы стала “несанкционированная модификация” системного промпта модели – базового набора инструкций, определяющих общие параметры поведения нейросети.

Технические специалисты компании подтвердили, что изменения были внесены в среду утром и направлены на программирование Grok для предоставления “специфических ответов” на “политические темы”.

Руководство xAI квалифицировало данные действия как нарушение “внутренней политики и ключевых ценностей” корпорации.

Принципиально важным аспектом данного инцидента является его рецидивный характер. В феврале 2025 года компания уже сталкивалась с аналогичным случаем несанкционированного вмешательства в алгоритмические инструкции Grok, когда нейросеть была запрограммирована на избирательную цензуру контента, связанного с Дональдом Трампом и основателем xAI Илоном Маском.

Тогда, по заявлению руководителя инженерного направления xAI Игоря Бабушкина, несанкционированные изменения также были внесены сотрудником компании и впоследствии устранены после выявления аномалий пользователями.