Anthropic、Claude Sonnet 4.6を発表、ほぼオーパス級のパフォーマンスと拡張された長文コンテキスト機能を実現

概要

AnthropicのClaude Sonnet 4.6は、ほぼOpusレベルの性能向上をもたらす大規模なアップグレードを導入し、より強力なコーディングやコンピュータ利用能力、そしてすべてのユーザーに対して従来と同じ価格で100万トークンのコンテキストウィンドウを提供します。

Anthropic Unveils Claude Sonnet 4.6, Delivering Near‑Opus Performance And Expanded Long‑Context Capabilities

AI安全性と研究を専門とするAnthropicは、これまでで最も高性能なSonnetモデルとされるClaude Sonnet 4.6を発表しました。このリリースは、コーディング、コンピュータ利用、長文コンテキスト推論、エージェント計画、知識作業、デザインにおいて全面的なアップグレードとして位置付けられ、ベータ版で100万トークンのコンテキストウィンドウを利用可能にしています。無料およびProプランのユーザーにとって、Sonnet 4.6はclaude.aiとClaude Coworkのデフォルトモデルとなり、価格はSonnet 4.5と変わりません。

このアップデートは、より高性能をより広い層に届けるための一歩と位置付けられています。モデルの早期テストを行った開発者からは、一貫性、指示追従性、文脈理解の向上により、Sonnet 4.5だけでなく、多くの場合、2025年後半のより高度なOpus 4.5モデルよりも優れているとの報告が寄せられています。以前はOpusクラスのシステムを必要としたタスク、特に実世界のオフィスワークフローに関連するものも、今やSonnet 4.6で実現可能とされています。同社はまた、コンピュータ利用能力の著しい向上も強調しており、これは以前のSonnetモデルが遅れていた分野です。

Anthropicは、モデルが広範な安全性評価を受けたことを強調しています。内部研究者は、Sonnet 4.6が堅牢な安全行動を示し、高リスクのミスアラインメントの兆候も見られないと述べており、これは責任あるAI開発に関する同社の全体的な立場を強化するポイントです。

コンピュータ利用能力の議論は、APIを介さずにソフトウェアを直接操作できるAIシステムの価値についてのより広範な議論を反映しています。Anthropicは、多くの組織が自動化が難しいレガシーツールに依存していることを指摘し、人間のようにコンピュータと対話できるモデルは、カスタム統合の必要性を減らすことができると述べています。

OSWorldなどのベンチマークは、実ソフトウェア環境を模擬し、Sonnetの開発16か月間にわたる着実な進歩を示しています。Sonnet 4.6の早期ユーザーは、複雑なスプレッドシートのナビゲーションや多段階のWebフォームの完了などのタスクを、人間に近いレベルで処理できるようになったと報告していますが、専門家にはまだ及びません。同時に、同社はプロンプトインジェクション攻撃などのリスクも認めており、以前のバージョンと比べて耐性が向上していると主張しています。

Sonnet 4.6はコード品質、推論、ツール使用を向上

コンピュータ利用を超えて、Anthropicはベンチマーク全体での広範な改善を報告しています。Claude Codeでは、ユーザーはほとんどのテストでSonnet 4.6をSonnet 4.5よりも好む傾向を示し、より良い文脈読解、重複の削減、信頼性の高いマルチステップ実行を挙げています。多くのユーザーはまた、Opus 4.5よりも優れていると評価し、過剰な設計になりにくく、指示に従う一貫性も高いと述べています。拡張されたコンテキストウィンドウにより、モデルは全コードベースや大規模な研究コレクションにわたって作業できるようになり、Anthropicは長期投資戦略を採用したとされるVending-Bench Arenaシミュレーションでのパフォーマンスも強調しています。

同社は、早期の顧客がフロントエンド開発、財務分析、ビジュアルデザインの質などの分野で改善を実感していると述べています。Sonnet 4.6はまた、Claude Developer PlatformやAPIのアップデートも含み、適応的および拡張的思考モード、コンテキスト圧縮、Web検索処理の改善、ツール使用能力の拡大などが追加されています。現在、すべてのClaudeプラン(無料プランも含む)で利用可能で、Claude Cowork、Claude Code、API、主要なクラウドプラットフォームを通じてアクセスできます。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.48K保有者数:2
    0.09%
  • 時価総額:$2.43K保有者数:1
    0.00%
  • 時価総額:$2.45K保有者数:2
    0.00%
  • 時価総額:$2.43K保有者数:0
    0.00%
  • 時価総額:$2.43K保有者数:1
    0.00%
  • ピン