Миллиарды на самоулучшение: компании учат ИИ переписывать себя

Рекурсивное самоулучшение — идея о том, что ИИ может сам дорабатывать собственный код и алгоритмы, — из теоретической концепции превращается в активно финансируемое направление. Несколько компаний инвестируют миллиарды в системы, способные ускорять собственное развитие без участия человека.

Принцип: система генерирует варианты изменений в коде, архитектуре или обучающих данных, автоматически оценивает каждый по заданным метрикам и использует лучшие результаты как основу следующего цикла. Без решений исследователя на каждом шаге — только автоматизированный отбор по числовым показателям.

Реальные возможности систем пока ограничены строго очерченными задачами: автоматически генерировать и проверять гипотезы в узких областях — синтез данных для обучения, оптимизация архитектуры нейросети, написание кода для собственных бенчмарков. Полноценного «ИИ, который делает себя умнее», пока не существует.

Японская лаборатория Sakana AI разрабатывает «ИИ-учёного» — систему, автоматически генерирующую и проверяющую научные гипотезы. Крупные лаборатории — OpenAI, Anthropic, Google DeepMind — инвестируют в автоматизированное исследование ИИ: подход, при котором одни модели занимаются улучшением других.

Главный аргумент инвесторов: если ИИ сможет самостоятельно проводить хотя бы часть работы, которую сейчас выполняют тысячи исследователей, скорость прогресса резко возрастёт.

Главный аргумент скептиков: метрики, по которым система оценивает себя, задаёт человек — и именно здесь легко ошибиться. ИИ будет оптимизировать то, что измеряется, а не то, что реально важно. В машинном обучении это называют законом Гудхарта: когда показатель становится целью, он перестаёт быть хорошим показателем.

У систем самоулучшения есть специфический класс рисков, не имеющий аналогов в обычной разработке ПО: система, способная изменять собственные веса или архитектуру, теоретически может сделать это способом, непредсказуемым для создателей.

Sakana AI показала, как «ИИ-учёный» самостоятельно генерирует и оформляет научные статьи; OpenAI и DeepMind автоматизировали части экспериментального цикла внутри собственных лабораторий. Но выбор задачи — что именно исследовать и что считать улучшением — по-прежнему остаётся за человеком: эту черту ни одна лаборатория пока не пересекла.