OpenAI представил семейство моделей GPT-4.1 с фокусом на код

Линейка включает три версии: полноразмерную GPT-4.1, уменьшенную GPT-4.1 mini и сверхкомпактную GPT-4.1 nano. Все модели семейства отличаются впечатляющим контекстным окном в 1 млн токенов, что позволяет им обрабатывать около 750 000 слов за один раз – это больше, чем объем романа «Война и мир».

Новые модели доступны через API OpenAI, но пока не интегрированы в ChatGPT. «Мы оптимизировали GPT-4.1 на основе прямой обратной связи от разработчиков, улучшив фронтенд-разработку, минимизацию лишних правок, следование форматам и структуре ответов», – сообщил представитель OpenAI.

Запуск GPT-4.1 происходит на фоне обострения конкуренции в сфере ИИ для программирования. Google недавно выпустила Gemini 2.5 Pro с аналогичным размером контекстного окна, Anthropic представила Claude 3.7 Sonnet, а китайский стартап DeepSeek обновил свою модель до версии V3.

По результатам внутреннего тестирования, флагманская GPT-4.1 показала результат 52-54,6% на бенчмарке SWE-bench Verified, немного уступив Gemini 2.5 Pro (63,8%) и Claude 3.7 Sonnet (62,3%). Однако модель установила рекорд в 72% точности при анализе длинных видео без субтитров в тесте Video-MME.

Компания также представила гибкую ценовую политику:

  • GPT-4.1: $2 за миллион входных токенов и $8 за миллион выходных
  • GPT-4.1 mini: $0,40 и $1,60 соответственно
  • GPT-4.1 nano: $0,10 и $0,40 – самая доступная модель OpenAI

Как отметила финансовый директор OpenAI Сара Фриар на недавнем технологическом саммите в Лондоне, конечная цель компании – создание «агентного программиста», способного самостоятельно разрабатывать приложения от начала до конца, включая тестирование и документацию. GPT-4.1 представляет собой важный шаг к этой амбициозной цели.

Новая модель получила расширенные возможности генерации – до 32 768 токенов за раз, что вдвое превышает показатель предшественника GPT-4o (16 384 токена), делая её более эффективной для решения сложных задач программирования.

Автор: Ирина Задорожная
Журналист с опытом работы в оффлайн-медиа и онлайн-изданиях. Пишу про искусственный интеллект, ИТ-системы и сервисы, про ИТ-бизнес уже 10 лет.