ИИ-стартап Anthropic обновил свою флагманскую модель Claude Opus до версии 4.6. Нейросеть стала лучше планировать действия, справляться с длительными задачами ИИ-стартап Anthropic обновил свою флагманскую модель Claude Opus до версии 4.6. Нейросеть стала лучше планировать действия, справляться с длительными задачами

Claude Opus 4.6 обошла GPT-5.2 в тестах на логику и получила «команду агентов»

2026/02/06 19:49
3м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

Claude Opus 4.6 обошла GPT-5.2 в тестах на логику и получила «команду агентов»

ИИ-стартап Anthropic обновил свою флагманскую модель Claude Opus до версии 4.6. Нейросеть стала лучше планировать действия, справляться с длительными задачами и эффективнее работать с объемными базами кода.

Контекстное окно расширили до 1 млн токенов. Такой объем позволяет анализировать массивные документы и вести долгие диалоги без потери логической нити.

Обновленные алгоритмы адаптированы для решения рабочих задач: проведению финансового анализа, исследования, использованию и созданию документов, таблиц и презентаций.

Opus 4.6 получила наивысшую оценку в тесте по программированию Terminal-Bench 2.0 и опередила конкурентов в сложном междисциплинарном бенчмарке на логическое мышление Humanity’s Last Exam.

Сравнение Opus 4.6 с конкурентами в ряде тестов. Источник: Anthropic.

В GDPval-AA, который оценивает качество рассуждений и принятия решений, модель превзошла GPT-5.2 от OpenAI. LLM также показала лучшие результаты в BrowseComp, который измеряет способность находить в интернете труднодоступную информацию.

Источник: Anthropic.

Opus 4.6 эффективно извлекает данные из объемных документов. Благодаря расширенному контекстному окну модель отслеживает и улавливает неочевидные скрытые детали.

Команды агентов

Ключевое нововведение — возможность создавать группы агентов для совместной работы. В таком режиме несколько ИИ-ассистентов работают параллельно и координируют свою работу автономно.

Инструмент подходит для поручений, которые разделяются на независимые и требуют анализа большого количества текста.

Замкнутый цикл

В Anthropic заявили, что «создают Claude вместе с Claude». Разработчики пишут код с помощью собственной ИИ-модели, а каждый новый продукт перед релизом проходит проверку на внутренних задачах компании.

Команда обнаружила, что Opus 4.6 уделяет больше внимания самым сложным частям задачи без дополнительных указаний, быстро выполняет простые поручения, лучше справляется с неоднозначными проблемами и сохраняет эффективность на длинных дистанциях.

Безопасность

Автоматизированный аудит выявил у Opus 4.6 низкую склонность к нежелательному поведению: обману, лести, укреплению заблуждений пользователя и содействию в неправомерных действиях.

Модель демонстрирует безопасность на уровне Opus 4.5. Источник: Anthropic.

Для проверки модели компания провела наиболее полную серию оценок, впервые применив новые методики тестирования и усовершенствовав существующие.

Доступность и новые функции

Claude Opus 4.6 уже доступна в веб-интерфейсе, через API и на основных облачных платформах.

В инструментарий для разработчиков новые функции:

  • адаптивное мышление — нейросеть самостоятельно определяет, когда необходимо задействовать режим глубокого рассуждения;
  • регулировка усилий — предусмотрено четыре уровня интенсивности работы: от низкого до максимального;
  • уплотнение контекста — инструмент автоматически резюмирует и заменяет старый контекст, когда разговор приближается к порогу токенов.

Opus 4.6 лучше работает с офисными инструментами вроде Excel и PowerPoint.

Напомним, в январе CEO Anthropic Дарио Амодеи предсказал скорое появление AGI и сокращения рабочих мест.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Возможности рынка
Логотип 4
4 Курс (4)
$0.014131
$0.014131$0.014131
-15.22%
USD
График цены 4 (4) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

RaveDAO вырос на 26%: данные на цепочке раскрывают, почему RAVE опередил основные альткоины

RaveDAO вырос на 26%: данные на цепочке раскрывают, почему RAVE опередил основные альткоины

RaveDAO (RAVE) показал рост на 26% по всем основным фиатным парам за последние 24 часа, опередив корреляцию Bitcoin на 28% и заняв позицию #89 по рыночной капитализации
Поделиться
Blockchainmagazine2026/04/12 18:06
Биткоин-фонды привлекают внимание ошеломляющими притоками

Биткоин-фонды привлекают внимание ошеломляющими притоками

Статья о том, как биткоин-фонды привлекают внимание ошеломляющими притоками средств, появилась на BitcoinEthereumNews.com. На прошлой неделе биржевые фонды (ETF) биткоина, котирующиеся в
Поделиться
BitcoinEthereumNews2026/04/12 18:30
OpenVPP противостоит рыночному спаду: почему 964 место OVPP сигнализирует о растущем институциональном интересе

OpenVPP противостоит рыночному спаду: почему 964 место OVPP сигнализирует о растущем институциональном интересе

Хотя большинство криптовалютных активов сталкиваются с давлением продаж, OpenVPP (OVPP) демонстрирует необычную устойчивость при рыночной капитализации $14,5 млн, занимая #964 место в мире. Наш on-chain анализ
Поделиться
Blockchainmagazine2026/04/12 18:08

Новости 24/7 в прямом эфире

Еще

Генезис USD1: 0% + 12% APR

Генезис USD1: 0% + 12% APRГенезис USD1: 0% + 12% APR

Новые пользователи: Стейкайте и получите до 600% APR