Anthropic представляет Claude Sonnet 4.6, обеспечивающий почти опусную производительность и расширенные возможности работы с длинным контекстом

Кратко

Claude Sonnet 4.6 от Anthropic представляет собой значительное обновление, которое обеспечивает почти уровень производительности Opus, улучшенные возможности кодирования и работы с компьютером, а также окно контекста на один миллион токенов для всех пользователей по той же цене, что и предыдущая версия.

Anthropic Unveils Claude Sonnet 4.6, Delivering Near‑Opus Performance And Expanded Long‑Context Capabilities

Компания Anthropic, занимающаяся безопасностью ИИ и исследованиями, объявила о выпуске Claude Sonnet 4.6, который считается самым мощным моделем Sonnet на сегодняшний день. Выпуск рассматривается как полное обновление в области кодирования, работы с компьютером, долгосрочного рассуждения, планирования агентов, работы с знаниями и дизайна, с бета-версией окна контекста на один миллион токенов. Для пользователей на бесплатных и платных планах Sonnet 4.6 становится моделью по умолчанию на claude.ai и Claude Cowork, при этом цена остается без изменений по сравнению с Sonnet 4.5.

Обновление позиционируется как шаг, который позволяет более широкой аудитории получить доступ к высокопроизводительным возможностям. Разработчики, тестировавшие модель на ранних этапах, сообщили, что улучшения в стабильности, следовании инструкциям и понимании контекста сделали её предпочтительнее не только Sonnet 4.5, но и, во многих случаях, более продвинутой модели Opus 4.5 конца 2025 года. Задачи, ранее требовавшие системы класса Opus — особенно связанные с реальными офисными рабочими процессами — теперь считаются выполнимыми с Sonnet 4.6. Компания также отмечает значительный скачок в возможностях работы с компьютером, области, в которой ранние модели Sonnet отставали.

Anthropic подчеркивает, что модель прошла обширные оценки безопасности. Внутренние исследователи описали Sonnet 4.6 как демонстрирующую сильное поведение в области безопасности и отсутствие серьезных признаков неправильного выравнивания в высокорискованных сценариях, что компания использует для укрепления своей позиции в области ответственного развития ИИ.

Обсуждение возможностей работы с компьютером отражает более широкую аргументацию о ценности систем ИИ, которые могут напрямую управлять программным обеспечением, а не через API. Anthropic отмечает, что многие организации используют устаревшие инструменты, которые трудно автоматизировать, и что модель, способная взаимодействовать с компьютером как человек, может снизить необходимость в пользовательских интеграциях.

Бенчмарки, такие как OSWorld, моделирующие реальные программные среды, показывают стабильный прогресс за шестнадцать месяцев разработки Sonnet. Ранние пользователи Sonnet 4.6 сообщают, что модель теперь может выполнять задачи, такие как навигация по сложным таблицам или заполнение многошаговых веб-форм, на уровне, приближающемся к человеческому, хотя и уступает экспертам. В то же время компания признает риски, такие как атаки с внедрением подсказок, и заявляет о повышенной устойчивости по сравнению с ранними версиями.

Sonnet 4.6 улучшает качество кода, рассуждения и использование инструментов

Помимо работы с компьютером, Anthropic сообщает о широких улучшениях по различным бенчмаркам. В Claude Code пользователи предпочитали Sonnet 4.6 Sonnet 4.5 в большинстве тестов, отмечая лучшее чтение контекста, снижение дублирования и более надежное выполнение многопроцессных задач. Многие также отдавали предпочтение ему перед Opus 4.5, описывая его как менее склонный к излишней сложности и более последовательный в следовании инструкциям. Расширенное окно контекста позволяет модели работать с целыми кодовыми базами или крупными исследовательскими коллекциями, а Anthropic выделяет её успехи в симуляции Vending‑Bench Arena, где модель приняла стратегию долгосрочных инвестиций, превзойдя конкурентов.

Компания отмечает, что ранние клиенты заметили улучшения в таких областях, как фронтенд-разработка, финансовый анализ и качество визуального дизайна. Sonnet 4.6 также вышел с обновлениями платформы Claude Developer и API, включая адаптивные и расширенные режимы мышления, сжатие контекста, улучшенную обработку веб‑поиска и расширенные возможности использования инструментов. Модель теперь доступна во всех планах Claude, включая бесплатный, и может быть использована через Claude Cowork, Claude Code, API и крупные облачные платформы.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить