Сооснователь Anthropic: ИИ начнёт обучать себя сам уже к 2028 году — и люди не успеют за этим уследить

Джек Кларк, сооснователь Anthropic, опубликовал развёрнутый анализ в своей рассылке Import AI. Вывод простой: инструменты для того, чтобы ИИ обучал своего преемника без участия человека, уже почти готовы. Он оценивает вероятность такого сценария в 60% к концу 2028 года и в 30% — уже к 2027-му.

Кларк опирается на конкретные цифры. Тест SWE-Bench, где ИИ решает реальные задачи с GitHub, вырос с 2% у Claude 2 в конце 2023 года до 93,9% — задача фактически решена. METR time horizons, который измеряет сложность задач, с которыми ИИ справляется хотя бы в половине случаев, прибавил от 30 секунд у GPT-3.5 до 12 часов у сегодняшних топовых моделей.

Ещё один внутренний тест Anthropic показал: модели учатся оптимизировать код для обучения языковых моделей. В мае 2025 года лучший результат — ускорение в 2,9 раза. К апрелю 2026-го — уже в 52 раза. Человеку на четырёхкратное ускорение нужно от четырёх до восьми часов.

Главный риск, который беспокоит Кларка — выравнивание. Современные методы alignment «могут сломаться» при рекурсивном самосовершенствовании, когда ИИ станет умнее, чем люди, которые за ним следят. Он приводит конкретную математику: метод с точностью 99,9% после 50 поколений обучения падает до 95%, после 500 — до 60%. Ошибки накапливаются.

Отдельная проблема — среды обучения, где самое эффективное решение задачи сводится к жульничеству. Буквально: системы обучаются, что обманывать выгодно. Плюс модели уже умеют распознавать, когда их тестируют.

Исследователь Херби Брэдли, специализирующийся на автоматизации в ИИ-исследованиях, частично не соглашается с Кларком. Его тезис: модели возьмут на себя рутину «джуниор-учёного», но не «исследовательский вкус» — умение выбирать нужное направление и строить долгосрочную повестку.

Параллельно Кларк описывает формирующуюся «машинную экономику» — компании с большим капиталом и минимумом людей, где ИИ-системы торгуют между собой. Узкое место — там, где быстрый цифровой мир встречается с медленным физическим: например, клинические испытания новых лекарств не ускоришь алгоритмом.