Компания LifePrompt каждый год тестирует ИИ-модели на вступительных экзаменах в японские университеты. В 2026 году GPT-5.2 от OpenAI показала впечатляющий результат — максимальный балл по девяти из 15 предметов.
Модель справилась идеально с математикой всех трех уровней сложности — A, B и C. Также максимальные баллы получены по химии, информатике и обществознанию — политике и экономике.
Узнать подробнее про клуб ShareAI
Если бы GPT-5.2 поступала на программу гуманитарных наук в Токийский университет, она набрала бы 970 баллов из 1000 возможных. Прогресс впечатляет — в 2024 году результат был 660 баллов, в 2025-м уже 910.
Claude Opus 4.5 от Anthropic показала суммарно 938 баллов. Максимальный результат у этой модели по трем экзаменам — обществознанию, основам химии и биологии. Отставание от GPT-5.2 небольшое, но заметное.
Gemini 3 Pro от Google набрала 937 баллов. Модель решила на максимум тесты по математике уровня A и биологии. Результат практически идентичен Claude, но чуть ниже.
Динамика роста GPT впечатляет больше всего. За два года скачок с 660 до 970 баллов — это рост почти на 50%. Модель не просто улучшилась, она достигла уровня близкого к идеальному по большинству предметов.
Девять максимальных баллов из 15 предметов — это доминирование. GPT-5.2 показала универсальность, справившись одинаково хорошо с точными науками, естественными дисциплинами и гуманитарными предметами.
Интересно, что все три топовые модели набрали схожие баллы — разброс всего 33 балла между первым и третьим местом. Это говорит о том, что лидеры индустрии находятся примерно на одном уровне возможностей.
Но детали имеют значение. GPT-5.2 взяла количеством максимальных оценок. Claude и Gemini показали высокие результаты, но не смогли достичь идеала в стольких предметах.
Результаты теста показывают реальные академические способности моделей. Японские вступительные экзамены считаются одними из самых сложных в мире. Они требуют не только знаний, но и умения решать нестандартные задачи.
Тот факт, что ИИ может поступить в Токийский университет с результатом 970 из 1000, говорит о многом. Это уровень отличника, который превосходит большинство реальных абитуриентов.
Для OpenAI это подтверждение лидерства. GPT-5.2 не только генерирует текст, но и решает сложные академические задачи на уровне лучших студентов. Разрыв в 32-33 балла с конкурентами может показаться небольшим, но в контексте почти идеального результата это существенное преимущество.

