Anthropicが最新AIモデル「Claude Opus 4.6」を発表、コーディング性能と100万トークン対応で大幅強化
最終更新日:2026年02月06日
記事監修者:AI Market ニュース配信チーム

Anthropicは2026年2月5日、最上位AIモデル「Claude Opus 4.6」を発表し、前モデルからコーディング能力やエージェント型タスクの持続性を大幅に向上させるとともに、Opusクラスとして初めて100万トークンのコンテキストウィンドウ(ベータ版)に対応したことを明らかにした。
- Claude Opus 4.6はコーディング能力が強化され、大規模コードベースでの信頼性向上やデバッグ精度の改善を実現
- Opusクラス初の100万トークンコンテキストウィンドウ(ベータ版)に対応し、長文脈での情報検索・推論性能が飛躍的に向上
- Terminal-Bench 2.0やGDPval-AAなど複数のベンチマークで業界最高スコアを達成し、安全性も前モデル同等以上を維持
Claude Opus 4.6は、前モデルであるClaude Opus 4.5のコーディングスキルを大きく改善したモデルだ。計画をより慎重に立て、エージェント型タスクをより長時間にわたって持続でき、大規模なコードベースにおいても安定して動作する。
さらに、コードレビューやデバッグのスキルが向上し、自らのミスを検出する能力も高まった。コーディング以外にも、財務分析やリサーチ、ドキュメント・スプレッドシート・プレゼンテーションの作成・利用といった日常的な業務タスクにも対応する。
Anthropicが提供する自律型マルチタスクツール「Cowork」上では、これらの能力を組み合わせてユーザーの代わりに作業を遂行できる。
ベンチマーク評価においては、複数の指標で業界最高水準の性能を示した。エージェント型コーディング評価「Terminal-Bench 2.0」で最高スコアを獲得したほか、複雑な多分野推論テスト「Humanity’s Last Exam」でも全フロンティアモデルの中でトップに立った。

経済的に価値のある知識労働タスクを評価する「GDPval-AA」では、OpenAIのGPT-5.2を約144 Eloポイント、前モデルのClaude Opus 4.5を190ポイント上回った。

長文脈処理の面では、100万トークン対応の「MRCR v2」(8ニードル版)でOpus 4.6が76%のスコアを記録し、Sonnet 4.5の18.5%を大きく凌駕した。これは、大量のテキストの中に埋もれた情報を正確に検索・推論する能力が質的に向上したことを示している。
安全性においても、知能の向上が安全性の犠牲の上に成り立つものではないことが確認された。自動化された行動監査では、欺瞞や迎合、ユーザーの妄想への加担、悪用への協力といった不整合行動の発生率が低く、前モデルと同等以上のアライメント水準を維持した。
さらに、無害な質問への過剰な拒否率は過去のClaudeモデルの中で最も低い。Anthropicは今回、過去最も包括的な安全性評価を実施し、ユーザーのウェルビーイングに関する新たな評価や、より複雑な有害リクエスト拒否テスト、解釈可能性(Interpretability)の手法を用いた内部動作の分析にも取り組んだ。
サイバーセキュリティ分野では6つの新しいプローブを開発し、悪用の追跡体制も強化した。
APIおよび製品面では、開発者向けに「アダプティブシンキング」機能を導入し、モデルが文脈に応じて拡張思考の使用を自動的に判断できるようになった。エフォートレベルはlow・medium・high(デフォルト)・maxの4段階から選択可能だ。
また、長時間のエージェント型タスクに対応する「コンテキストコンパクション」(ベータ版)により、古い文脈を自動要約してコンテキストウィンドウの制限を回避する。Claude Codeでは、複数のエージェントが並列で協調する「エージェントチーム」機能をリサーチプレビューとして公開した。
さらに、Claude in Excelの性能が大幅に改善され、Claude in PowerPointもリサーチプレビューとしてMax・Team・Enterpriseプランで利用可能となった。
価格は従来と同じく入力100万トークンあたり5ドル、出力100万トークンあたり25ドルで、20万トークンを超えるプロンプトにはプレミアム価格が適用される。
AI Market の見解
Claude Opus 4.6は、コーディング能力と長文脈処理の両面で顕著な性能向上を達成しており、特にGDPval-AAにおけるGPT-5.2との144 Eloポイント差は、実務的な知識労働タスクにおける優位性を明確に示している。
100万トークンのコンテキストウィンドウ対応は、大規模なコードベースのレビューや長大なドキュメントの分析といったエンタープライズ用途での活用範囲を大きく広げると想定される。
アダプティブシンキングやコンテキストコンパクションといったAPI機能の充実は、開発者がコストと性能のバランスを柔軟に調整できる仕組みであり、エージェント型AIの実用化を加速させる要素となる。
また、安全性を犠牲にせず性能を向上させた点は、企業導入における信頼性の観点からも重要だ。Claude in ExcelやPowerPointへの対応拡大は、開発者だけでなく一般のビジネスユーザーへのAI浸透を促進するものであり、今後のオフィスツール市場における競争力強化につながると想定される。
参照元:Anthropic
Claude Opus 4.6に関するよくある質問まとめ
- Claude Opus 4.6の利用料金はいくら?
APIでの利用料金は入力100万トークンあたり5ドル、出力100万トークンあたり25ドルで、前モデルと同一の価格体系だ。ただし、20万トークンを超えるプロンプトにはプレミアム価格(入力10ドル、出力37.50ドル)が適用される。claude.ai、API、主要クラウドプラットフォームから利用可能だ。
- Claude Opus 4.6のコンテキストウィンドウはどれくらいか?
Opusクラスとして初めて100万トークンのコンテキストウィンドウにベータ版として対応した。MRCR v2(8ニードル版)では76%のスコアを記録しており、大量のテキストから必要な情報を正確に検索する能力が大幅に向上している。出力は最大12万8000トークンまで対応する。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
