Компания Anthropic выпустила новую модель искусственного интеллекта Claude Sonnet 4.5. По заявлению разработчиков, это лучшая в мире модель для кодирования, создания сложных агентов и использования компьютеров. Она также значительно улучшена в области логики и математики.
Claude Sonnet 4.5 уже доступен для всех пользователей. Разработчики могут использовать его через API Claude с обозначением claude-sonnet-4-5. Цены остаются такими же, как и для версии Sonnet 4: $3/$15 за миллион токенов.
Узнать подробнее про клуб ShareAI
Новая модель занимает первое место в оценке SWE-bench Verified, которая измеряет навыки программирования в реальных задачах. На практике она способна сохранять фокус более 30 часов при работе над сложными задачами.
В тесте OSWorld, который проверяет работу моделей ИИ с компьютерными задачами, Sonnet 4.5 достиг показателя 61,4%. Для сравнения: всего четыре месяца назад Sonnet 4 лидировал с результатом 42,2%.
Вместе с новой моделью компания представила ряд важных обновлений для своих продуктов. В Claude Code добавлены контрольные точки — одна из самых востребованных функций, которая сохраняет прогресс и позволяет мгновенно вернуться к предыдущему состоянию. Обновлен интерфейс терминала и выпущено нативное расширение для VS Code.
Для API Claude добавлены новые инструменты редактирования контекста и работы с памятью, что позволяет агентам работать дольше и справляться с более сложными задачами. В приложениях Claude теперь доступны выполнение кода и создание файлов (таблицы, презентации и документы) прямо в диалоге.
Anthropic также выпустила Claude Agent SDK — тот же инфраструктурный набор, который используется для создания Claude Code. Теперь разработчики могут использовать эти инструменты для создания собственных агентов.
По данным компании, Claude Sonnet 4.5 является не только самой мощной, но и самой безопасной моделью. Разработчики улучшили поведение модели, снизив проявление таких проблем, как сервильность, обман, стремление к власти и склонность поощрять бредовое мышление. Для агентских возможностей и использования компьютера также достигнут значительный прогресс в защите от атак с внедрением промптов.
В качестве временной исследовательской демонстрации Anthropic также выпустила «Imagine with Claude» — эксперимент, в котором Claude создает программное обеспечение на лету. Эта функция доступна подписчикам Max в течение пяти дней.