Модель GPT-5 Pro показала рекордный IQ среди ИИ

Платформа Tracking AI опубликовала обновленный рейтинг ИИ-моделей по результатам тестов на IQ. Первые два места заняли версии GPT-5 Pro с показателями от 110 до 138 баллов, что превышает средний человеческий IQ в 100 баллов. Следом расположились Gemini 2.5 Pro, Claude Opus 4 и Grok 4.

Исследователи использовали два типа тестов для проверки моделей. Первый - официальный тест Mensa Norway из 35 задач за 25 минут. Второй - специальный набор задач, созданный с нуля и отсутствующий в интернете, чтобы модели не могли заранее на него натренироваться.

Тестирование проводилось с включенным и выключенным компьютерным зрением.

В отличие от людей, ИИ получал до 10 попыток на решение каждой задачи без ограничений по времени. Это сделано для компенсации ложных срабатываний систем безопасности, которые иногда блокируют слова типа “экзамен” или “тренировка”.

Результаты показали интересную особенность - другие версии GPT-5 оказались менее успешными. GPT-5-Thinking разместился в середине таблицы, уступив модели предыдущего поколения o3 и базовой версии GPT-5. Это указывает либо на несовершенство IQ-тестов для оценки ИИ, либо на необходимость доработки режима рассуждений.

Почти все модели показали худшие результаты в оффлайн-тесте по сравнению с официальным Mensa. Это подтверждает предположение о том, что качественные тесты для ИИ нужно создавать заново и следить, чтобы они не попали в тренировочные данные будущих моделей.