OpenAI выпустила две революционные модели рассуждения — o3 и o4-mini, которые способны приостанавливаться и обдумывать вопросы перед ответом. Модель o3 названа самой продвинутой моделью рассуждения OpenAI за всю историю компании, превосходящей предыдущие разработки в тестах по математике, программированию, рассуждению и науке.
В то же время, o4-mini предлагает конкурентоспособный баланс между ценой, скоростью и производительностью. В отличие от прежних моделей, o3 и o4-mini могут генерировать ответы, используя инструменты ChatGPT, включая веб-браузинг, выполнение Python-кода, обработку изображений и генерацию изображений.
Начиная с сегодняшнего дня, модели, а также вариант o4-mini-high, который тратит больше времени на формулирование ответов для повышения надежности, доступны для подписчиков планов OpenAI Pro, Plus и Team.
Новые модели являются частью стратегии OpenAI в конкурентной борьбе с Google, Meta, xAI, Anthropic и DeepSeek на глобальном рынке ИИ. Хотя OpenAI первой выпустила модель рассуждения o1, конкуренты быстро последовали с собственными версиями, которые соответствуют или превосходят производительность линейки OpenAI.
Фактически, модели рассуждения начали доминировать в отрасли, поскольку ИИ-лаборатории стремятся выжать максимум производительности из своих систем.
OpenAI утверждает, что o3 достигает передовых показателей на SWE-bench verified, тесте, измеряющем способности к программированию, набирая 69.1%. Модель o4-mini достигает аналогичных результатов — 68.1%. Следующая лучшая модель OpenAI, o3-mini, набрала 49.3% в этом тесте, а Claude 3.7 Sonnet — 62.3%.
OpenAI заявляет, что o3 и o4-mini — это первые модели компании, способные «мыслить изображениями». На практике пользователи могут загружать изображения в ChatGPT, например, наброски на доске или диаграммы из PDF-файлов, и модели будут анализировать изображения во время фазы «цепочки размышлений» перед ответом.
Благодаря этой новой способности, o3 и o4-mini могут понимать размытые и низкокачественные изображения и выполнять такие задачи, как увеличение или вращение изображений в процессе рассуждения.