Вчера в 09:50

Anthropic выпустили в релиз Claude Opus 4.6 — обновление наиболее мощной ИИ-модели разработчика

Изображение: Aerps.com (unsplash)

Компания Anthropic объявила о релизе Claude Opus 4.6 — обновлённой версии своей флагманской модели искусственного интеллекта. Разработчик сообщил об улучшениях в работе с кодом, длинным контекстом и прикладными задачами, а также о сохранении прежнего уровня безопасности и стоимости использования.

Главный фокус у Opus 4.6 ожидаемо на программировании. Модель дольше удерживает контекст, спокойнее ведёт сложные цепочки рассуждений и увереннее ориентируется в крупных кодовых базах.

Планирование шагов стало аккуратнее, а собственные промахи при ревью и отладке она замечает чаще. В результате работа с большим проектом выглядит менее рваной и ближе к тому, как действует живой разработчик, который не теряет нить после десятого файла.

Параллельно модель заметно подтянулась в прикладных сценариях. Финансовые расчёты, исследовательские заметки, документы, таблицы и презентации обрабатываются быстрее и ровнее. В среде Cowork Claude такие задачи выполняются автономно и параллельно, без постоянных подсказок со стороны пользователя, что больше похоже на асинхронного коллегу, чем на привычного чат-бота.

Цифры бенчмарков тоже сложились в приятную для Anthropic картину. Opus 4.6 вышел в лидеры агентного программирования на Terminal-Bench 2.0, занял первое место в Humanity’s Last Exam и уверенно обошёл конкурентов в GDPval-AA, где оцениваются экономически значимые задачи из финансовой, юридической и аналитической сфер. Отдельно отмечается более уверенный поиск редкой информации в интернете, когда ответ не лежит на поверхности.

Особый акцент сделан на длинный контекст. Opus 4.6 заметно реже теряет данные в больших диалогах и объёмных документах. В тестах, где нужные факты спрятаны внутри массивов текста, разрыв с предыдущими версиями измеряется не долями процентов, а кратным ростом качества. Это хорошо чувствуется в реальной работе с отчётами и исследовательскими архивами.

Разработчики отдельно указывают, что рост возможностей не потянул за собой проблем с безопасностью. Профиль остался спокойным, без всплесков дезориентации, лишних отказов и других побочных эффектов, которые часто появляются вместе с усложнением моделей.

Для тех, кто работает через API, добавлены новые инструменты. Появились уровни effort для баланса глубины рассуждений и скорости, адаптивное мышление, автоматическое сжатие контекста и поддержка очень длинных выводов до 128 тыс. токенов. Ценник при этом не пересматривался.

Claude Opus 4.6 уже открыт в интерфейсе Claude, доступен через API и развёрнут на облачных платформах.

Автор: Артем

Представитель редакции CISOCLUB. Пишу новости, дайджесты, добавляю мероприятия и отчеты.

Комментарии: