ИИ, который строит себя сам: Anthropic предупреждает о потере контроля — и одновременно жмёт на газ

4 июня Anthropic опубликовала доклад «Когда ИИ строит себя сам». Главный факт: Claude теперь пишет больше 80% кода, который попадает в его собственную кодовую базу. До того как Claude Code вышел в режиме исследовательского превью в феврале прошлого года, эта цифра была в районе нескольких процентов.

Исследовательское подразделение Anthropic Institute называет происходящее ранней стадией рекурсивного самосовершенствования. Это ситуация, когда модель проектирует и создаёт своего преемника без значимого участия человека. Предупреждение прямое: редкие сбои в поведении нынешних моделей могут «становиться всё более частыми, но всё менее понятными — пока мы не потеряем над ними контроль».

Парадокс в том, что несколько недель назад Anthropic признала: их модель Mythos оказалась слишком мощной, чтобы выпустить её публично. Теперь та же компания говорит о необходимости паузы — и одновременно продолжает учить Claude строить самого себя быстрее.

В самом докладе Anthropic признаёт: петля уже начала ускорять разработку ИИ так, что люди рискуют потерять контроль над создаваемыми системами. Смысл предупреждения — не остановиться прямо сейчас, а успеть выстроить системы контроля до того, как петля самосовершенствования замкнётся окончательно.

Цикл уже работает: Claude пишет код, который делает Claude лучше, который пишет код ещё лучше. С февраля 2025 года темп резко ускорился. Anthropic фиксирует это сама — и сама же бьёт тревогу.