OpenAI выпускает GPT-4.1 с существенным приростом эффективности

Компания OpenAI представила GPT-4.1 — специализированную языковую модель с оптимизированной архитектурой для программирования и выполнения комплексных инструкций. Данный релиз реализуется в двух конфигурациях: полноразмерной GPT-4.1 и компактной GPT-4.1 mini, последняя из которых заменяет ранее представленную GPT-4o mini.

В области программной инженерии GPT-4.1 достигает показателя 54.6% на бенчмарке SWE-bench Verified, что представляет абсолютный прирост в 21.4% по сравнению с GPT-4o и 26.6% относительно GPT-4.5. Это позиционирует новую модель как лидирующее решение для задач, связанных с генерацией и анализом программного кода.

В аспекте следования инструкциям, который измеряется с помощью бенчмарка Scale’s MultiChallenge, модель демонстрирует результат в 38.3%, превосходя GPT-4o на 10.5% в абсолютном выражении. Данный параметр имеет критическое значение для практического применения в корпоративной среде и системах автоматизации, требующих высокоточного выполнения заданных алгоритмов действий.

Обработка длинного контекста, оцениваемая через бенчмарк Video-MME, также демонстрирует значительный прогресс. GPT-4.1 устанавливает новый отраслевой стандарт с показателем 72.0% в категории длинных контекстов без субтитров, что на 6.7% превосходит результаты GPT-4o. Эта метрика особенно значима для задач, требующих когерентного анализа объемных информационных массивов.

Технологическая инфраструктура модели обеспечивает расширенные возможности обработки данных. В среде API GPT-4.1 поддерживает работу с контекстами объемом до миллиона токенов, однако в пользовательском интерфейсе ChatGPT сохраняются предыдущие лимиты: 32,000 токенов для подписчиков Plus и 128,000 токенов для владельцев Pro-аккаунтов.

Релиз сопровождается оптимизацией ценообразования. Согласно официальной документации, новые модели предлагают повышенную производительность при сниженной стоимости использования, что создает дополнительные экономические стимулы для интеграции в существующие технологические стеки.

Автор: Александр Чернов
Журналист с техническим бэкграундом, пишущий о практических аспектах внедрения искусственного интеллекта. Бывший главред федерального издания. Любит сбалансированную подачу информации без хайпа.