Anthropic выпустила Claude Opus 4.6 с контекстным окном 1 миллион токенов

Anthropic представила Claude Opus 4.6 с улучшенными навыками кодирования. Модель тщательнее планирует, дольше выполняет агентные задачи и надежнее работает в больших базах кода. Впервые для класса Opus доступно контекстное окно в 1 миллион токенов в бета-версии.

Opus 4.6 применяет улучшенные способности к повседневным рабочим задачам. Финансовый анализ, исследования, работа с документами, таблицами и презентациями. В Cowork, где Claude работает автономно, Opus 4.6 использует все навыки от имени пользователя.

Модель показала лучшие результаты на нескольких тестах. Высший балл на Terminal-Bench 2.0 для оценки агентного кодирования. Лидерство среди фронтир-моделей на Humanity’s Last Exam - сложном междисциплинарном тесте.

На GDPval-AA модель превзошла лучшую модель индустрии GPT-5.2 от OpenAI примерно на 144 пункта Elo. Собственного предшественника Claude Opus 4.5 опередила на 190 пунктов. Это оценка выполнения ценных задач в финансах, праве и других областях.

Opus 4.6 лучше любой модели на BrowseComp. Этот тест измеряет способность находить труднодоступную информацию онлайн.

Модель показывает общий профиль безопасности не хуже любой фронтир-модели в индустрии. Низкие показатели неправильного поведения в тестах безопасности.

В Claude Code теперь можно собирать команды агентов для совместной работы. В API Claude использует компактификацию для суммирования собственного контекста и выполнения более долгих задач. Появилось адаптивное мышление - модель улавливает контекстные подсказки о том, насколько использовать расширенное мышление. Новые элементы управления усилием дают разработчикам больше контроля над интеллектом, скоростью и стоимостью.

Существенные обновления Claude in Excel. Выпущена Claude in PowerPoint в режиме исследовательского превью. Это делает Claude гораздо более способным для повседневной работы.

Claude Opus 4.6 доступна на claude.ai, через API и на всех крупных облачных платформах. Разработчики используют claude-opus-4-6 через Claude API. Цены остались прежними - $5/$25 за миллион токенов.

Opus 4.6 часто думает глубже и тщательнее пересматривает рассуждения перед ответом. Это дает лучшие результаты на сложных задачах, но добавляет стоимость и задержку на простых. Рекомендуется снизить усилие с высокого на средний уровень, если модель слишком много думает. Контроль через параметр /effort.

Модель лучше извлекает информацию из больших наборов документов. На 8-needle 1M варианте MRCR v2 Opus 4.6 набрала 76%, тогда как Sonnet 4.5 только 18,5%. Это качественный скачок в объеме контекста, который модель может использовать при пиковой производительности.