GPT-5.4 Pro решил математическую задачу, которую люди не могли решить с 2019 года

OpenAI запустила GPT-5.4 Pro 5 марта как обычную универсальную модель — без специализации под математику. Тем не менее она решила задачу по теории гиперграфов Рамси, которую математики Уилл Брайан и Пол Ларсон поставили в 2019 году и с тех пор не могли закрыть. Решение независимо проверила Epoch AI.

Суть задачи — улучшить нижние оценки для последовательности, возникающей при изучении сходимости бесконечных рядов. GPT-5.4 Pro не просто нашёл ответ: он устранил неэффективность в существующих конструкциях и получил совпадающие нижнюю и верхнюю оценки. В комбинаторике добиться такого совпадения — серьёзный результат, разрыв между оценками там может держаться десятилетиями.

Автор задачи Уилл Брайан оценил решение как пригодное для публикации в специализированном журнале. Он признался, что сам думал о похожем подходе, но считал его слишком сложным для реализации.

GPT-5.4 Pro решила задачу первой, но не единственной. После первоначального результата Epoch AI специально протестировала другие топовые модели с помощью универсального стенда. Anthropic Opus 4.6, Google Gemini 3.1 Pro и GPT-5.4 (xhigh) тоже нашли корректные конструкции — каждая на части попыток. Все четыре протестированные модели справились с задачей хотя бы на части попыток — это говорит о том, что математические способности стали общим свойством ведущих ИИ-систем, а не достижением одной.

Прогресс на бенчмарке FrontierMath наглядный: GPT-4 в 2024 году набирал около 5% на задачах уровня от бакалавра до постдока, GPT-5.4 Pro сегодня — 50%. На задачах исследовательского уровня (Tier 4) — 38%. С Рождества 2025 года закрыто 15 открытых математических проблем, 11 из них (73%) — с участием ИИ.

Двое ведущих математиков прокомментировали результат с диаметрально противоположных позиций. Лауреат медали Филдса Теренс Тао видит в этом шанс: у исследователей всегда не хватало внимания на большинство задач, и ИИ может стать соавтором, генерирующим кандидатов на доказательства. Логик из Нотр-Дам Джоэл Дэвид Хэмкинс настроен иначе — для его фундаментальных исследований польза от ИИ «практически нулевая».

Исследователи Кевин Барето и Лиам Прайс, которые первыми получили решение от модели, могут стать соавторами публикации. Брайан готов включить их в статью — это поднимает новые вопросы об атрибуции и распределении заслуг в рецензируемой математике.