Anthropic社、Claude 4を発表。世界最高のコーディング性能を実現
最終更新日:2025年05月23日

Anthropic社は2025年5月23日、次世代AIモデル「Claude Opus 4」と「Claude Sonnet 4」を発表した。
Claude Opus 4は世界最高のコーディングモデルとして、SWE-benchで72.5%の成績を記録し、長時間の複雑なタスクに対応可能な性能を実現している。
- Claude Opus 4が世界最高のコーディングモデルとしてSWE-benchで72.5%を達成し数時間の連続作業が可能
- Claude Sonnet 4がSonnet 3.7から大幅に性能向上しSWE-benchで72.7%のスコアを記録
- 拡張思考機能とツール使用の並列実行により従来比65%のショートカット行動を削減
Claude Opus 4は、SWE-benchで72.5%、Terminal-benchで43.2%という業界最高水準の性能を達成し、世界最高のコーディングモデルとしての地位を確立した。
このモデルは数千のステップを要する長時間タスクにおいて持続的な性能を発揮し、数時間にわたって連続的に作業を継続する能力を持つ。
Cursor、Replit、Block、Rakutenなどの企業からも高い評価を受けており、特にRakutenでは7時間の独立稼働による大規模なオープンソースリファクタリングを成功させた。
Cognitionは、他のモデルでは解決できない複雑な課題に対してOpus 4が優れた性能を発揮すると評価している。
Claude Sonnet 4は、業界をリードするSonnet 3.7の性能を大幅に向上させ、SWE-benchで72.7%という最先端のスコアを記録した。
このモデルは性能と効率のバランスを重視し、内部・外部の両方の用途において実装に対するより高い制御性を提供する。
GitHubはSonnet 4をGitHub Copilotの新しいコーディングエージェントのベースモデルとして採用することを発表し、Manusは複雑な指示への対応力向上を評価している。
iGentは自律的なマルチ機能アプリ開発において、ナビゲーションエラーを20%からほぼゼロまで削減したと報告している。
両モデルには拡張思考機能とツール使用の並列実行機能が搭載され、従来のSonnet 3.7と比較してタスク完了のためのショートカットや抜け道を使用する行動を65%削減した。
Claude Opus 4は特にメモリ機能において劇的な改善を示し、開発者がローカルファイルアクセスを提供した場合、重要な情報を保存する「メモリファイル」の作成と維持が可能になる。
この機能により、長期的なタスク認識、一貫性、エージェントタスクでの性能が向上し、実際にポケモンゲームプレイ中に「ナビゲーションガイド」を作成する事例も報告されている。
Claude 4モデルと併せて、Claude Codeが正式リリースされ、VS CodeやJetBrainsとのネイティブ統合、GitHub Actionsを通じたバックグラウンドタスクのサポートが追加された。
Anthropic APIには4つの新機能として、コード実行ツール、MCPコネクタ、Files API、最大1時間のプロンプトキャッシュ機能が提供される。
価格設定は従来モデルと同様で、Opus 4が入力/出力あたり15ドル/75ドル、Sonnet 4が3ドル/15ドルとなっている。
AI Marketの見解
Claude 4の発表は、AIモデルの性能向上において特にコーディング分野での大きな進歩を示している。
SWE-benchでの70%超えという成績は、実際のソフトウェア開発タスクにおけるAIの実用性が大幅に向上したことを意味し、開発者の生産性向上に直接的な影響を与えると想定される。
拡張思考機能とツール使用の並列実行は、従来のLLMの制約を克服する技術的ブレークスルーであり、より複雑なタスクの自動化を可能にする。
特にOpus 4の数時間にわたる連続作業能力は、エンタープライズレベルでのAIエージェント活用に新たな可能性を開く。
メモリ機能の強化により、長期的なプロジェクト管理やコンテキスト保持が改善され、よりスマートなAIアシスタントの実現に向けた重要な一歩と評価できる。
参照元:Anthropic PBC
Claude 4に関するよくある質問まとめ
- Claude 4モデルの利用料金はどのように設定されているか?
Claude Opus 4は入力トークン100万件あたり15ドル、出力トークン100万件あたり75ドル、Claude Sonnet 4は入力トークン100万件あたり3ドル、出力トークン100万件あたり15ドルとなっている。これは従来のOpusおよびSonnetモデルと同一の価格設定だ。
- Claude 4の拡張思考機能とはどのような機能か?
拡張思考機能は、AIモデルがより深い推論を行うための機能で、ツール使用と組み合わせることで推論とツール利用を交互に行いながら回答の品質を向上させる。思考プロセスの約5%のケースでのみ要約が必要で、ほとんどの場合は完全な思考過程が表示される。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
