Компания OpenAI выпустила открытые модели рассуждения

OpenAI объявила о выпуске двух ИИ-моделей с открытыми весами, специализирующихся на рассуждении и обладающих функциональностью, сопоставимой с закрытыми моделями o-серии компании. Обе модели доступны для свободного скачивания на платформе Hugging Face и демонстрируют передовую производительность по ключевым бенчмаркам в сегменте открытых моделей.

Релиз представлен двумя вариантами: масштабной моделью gpt-oss-120b с расширенными возможностями, функционирующей на одном графическом процессоре Nvidia, и компактной версией gpt-oss-20b, оптимизированной для работы на потребительских ноутбуках с оперативной памятью от 16 ГБ.

Интересуетесь ИИ? Международный клуб ShareAI Александра Горного - объединяет тех, кто хочет внедрить в свой бизнес или работу ИИ или погрузиться в эту тему. Онлайн и оффлайн.
Узнать подробнее про клуб ShareAI

Данный запуск знаменует первый выход OpenAI на рынок открытых языковых моделей с момента представления GPT-2 более пяти лет назад.

В ходе технического брифинга представители OpenAI акцентировали внимание на интероперабельности новых моделей, которые способны формировать и отправлять сложные запросы к облачным ИИ-системам.

Это архитектурное решение обеспечивает возможность делегирования специализированных задач, таких как обработка изображений, более производительным закрытым моделям компании при недостаточности локальных вычислительных ресурсов.

Стратегический контекст выпуска открытых моделей характеризуется фундаментальным изменением в позиционировании OpenAI на рынке искусственного интеллекта.

После начального периода приверженности принципам открытого исходного кода компания преимущественно реализовывала проприетарную модель разработки, что способствовало формированию масштабного бизнеса по предоставлению доступа к ИИ-моделям через API корпоративным клиентам и разработчикам.

Однако в январе текущего года генеральный директор OpenAI Сэм Альтман публично признал, что компания «оказалась на неправильной стороне истории» в вопросах открытого распространения своих технологий.

Текущая инициатива реализуется на фоне возрастающего конкурентного давления со стороны китайских исследовательских лабораторий, включая DeepSeek, Qwen от Alibaba и Moonshot AI, которые разработали ряд наиболее функциональных и востребованных открытых моделей в глобальном масштабе.

Автор: Александр Чернов
Журналист с техническим бэкграундом, пишущий о практических аспектах внедрения искусственного интеллекта. Бывший главред федерального издания. Любит сбалансированную подачу информации без хайпа.