Image default
Новости

Anthropic представила Claude Opus 4.5 — самую продвинутую модель в своей линейке


В понедельник компания Anthropic анонсировала Opus 4.5 — новую версию своей флагманской модели. Это последняя модель из серии 4.5, следом за выпуском Sonnet 4.5 в сентябре и Haiku 4.5 в октябре.

Как и ожидалось, новая версия Opus демонстрирует передовые результаты на ряде тестов, включая бенчмарки для программирования (SWE-Bench и Terminal-bench), работы с инструментами (tau2-bench и MCP Atlas), а также решения общих задач (ARC-AGI 2, GPQA Diamond).

Особенно примечательно, что Opus 4.5 стала первой моделью, набравшей более 80% на SWE-Bench verified — авторитетном тесте для программистов.

Anthropic также отдельно подчеркнула способности Opus в работе с компьютерами и электронными таблицами, а также представила ряд сопутствующих продуктов, демонстрирующих эффективность модели в этих сценариях. Одновременно с Opus 4.5 компания сделает продукты Claude для Chrome и Claude для Excel — ранее находившиеся в пилотном режиме — доступными широкой публике. Расширение для Chrome смогут использовать все пользователи тарифа Max, а модель для Excel — пользователи Max, Team и Enterprise.

Opus 4.5 также получила улучшения в работе с памятью при обработке длинных контекстов, что потребовало значительных изменений в управлении памятью модели.

«Мы улучшили качество обработки длинного контекста в обучении Opus 4.5, но одних только больших окон контекста недостаточно», — рассказала Дайан На Пенн, руководитель по управлению продуктами в исследовательском подразделении Anthropic. — «Очень важно не просто иметь длинное окно, но и уметь запоминать по-настоящему важные детали».

Эти изменения также позволили реализовать давно ожидаемую функцию «бесконечного чата» для платных пользователей Claude: теперь диалог продолжится без перерыва, даже если модель достигнет лимита окна контекста — вместо этого контекст будет сжиматься без уведомления пользователя.

Многие из обновлений ориентированы на агентные сценарии использования, в частности — когда Opus выступает в роли главного агента, управляющего группой подагентов на базе Haiku. Такие задачи требуют высокой эффективности рабочей памяти, и именно здесь улучшения, о которых говорила Пенн, проявляют себя особенно ярко.

«В этом и кроется важность фундаментальных вещей, таких как память», — говорит Пенн. — «Claude должен уметь изучать большие кодовые базы и документы, а также понимать, когда нужно вернуться назад и перепроверить что-то».

Opus 4.5 предстоит конкурировать с другими недавно представленными моделями передового уровня, в частности — с GPT 5.1 от OpenAI (выпущен 12 ноября) и Gemini 3 от Google (выпущен 18 ноября).



Источник

Статьи по теме

Выручка Alibaba Cloud выросла на 34% на фоне ИИ-бума, но прибыль снизилась

admin

Mozilla поменяла генерального директора и делает ставку на ИИ в «войне браузеров»

admin

Создан инновационный ИИ-бокс для тестирования пожарной сигнализации на атомных объектах

admin

Оставить комментарий