OpenAI выпустил масштабное обновление для Codex — инструмента для разработчиков, который теперь умеет гораздо больше, чем просто писать код.
Главная новинка — «фоновое управление компьютером». Codex видит экран пользователя, двигает курсором, кликает и печатает в любых приложениях на Mac. Несколько агентов могут работать одновременно, не мешая тому, что делает сам пользователь. Это особенно полезно для фронтенд-разработки и тестирования — там, где у приложений нет API.
Агент теперь умеет планировать задачи наперёд и самостоятельно «просыпаться», чтобы продолжить работу. OpenAI говорит, что Codex может вести проекты «днями и даже неделями» без участия человека. Команды могут подключить его к обработке pull request’ов, мониторингу задач и переписке в Slack, Gmail и Notion.
В обновление вошло ещё несколько важных функций. Codex теперь генерирует изображения через модель gpt-image-1.5 прямо внутри рабочего процесса — для макетов, UI-дизайна и игровой графики. Добавлен встроенный браузер, где можно оставлять комментарии прямо на странице, чтобы давать агенту точные инструкции. Плюс — подключение к удалённым devbox’ам через SSH и поддержка более 90 новых плагинов: Atlassian, GitLab, CircleCI, Microsoft Suite и другие.
Обновление уже доступно пользователям десктопного приложения Codex с аккаунтом ChatGPT. Функция управления компьютером пока только для macOS; пользователи из ЕС и Великобритании получат её позже. Персонализация и память появятся отдельно — для пользователей Enterprise, Edu, ЕС и Великобритании.
Обновление выглядит как прямой ответ на Claude Code от Anthropic. OpenAI сделал ставку на автономность: по собственным словам компании, Codex способен вести проекты «дни и даже недели» без участия человека.