OpenAI、GPT-5.2-Codexをリリース、サイバーセキュリティ能力を大幅強化しプロレベルの脆弱性発見を実現
最終更新日:2025年12月23日

OpenAIは2025年12月18日、エージェント活用型コーディングモデルGPT-5.2-Codexをリリースした。GPT-5.2をコーディング向けに最適化し、長期的作業への対応強化、大規模コード変更での性能向上、Windows環境の改善に加え、サイバーセキュリティ機能を大幅に強化した点が特徴だ
- GPT-5.2-Codexが有料ChatGPTユーザー向けに提供開始、SWE-Bench Proで56.4%の精度を達成し最先端性能を実現
- セキュリティ研究者がGPT-5.1-Codex-Maxを使用してReactの未知の脆弱性を1週間で発見し責任ある開示を実施
- 審査済みセキュリティ専門家向けにtrusted accessパイロットを導入、防御的サイバーセキュリティ業務での制限の少ないアクセスを提供
GPT-5.2-Codexは、GPT-5.2の強みとGPT-5.1-Codex-Maxのエージェント活用型コーディング能力を基盤とし、長文コンテキストの理解、信頼性の高いツール呼び出し、ネイティブなコンテキスト圧縮を強化した。

これにより、推論のトークン効率を維持しながら長時間のコーディング作業でより信頼できるパートナーとして機能する。現実的なターミナル環境でのエージェント性能を評価するSWE-Bench ProおよびTerminal-Bench 2.0において最先端の性能を達成し、それぞれ56.4%、64.0%の精度を記録した。
Windows環境でのエージェント活用型コーディングの効果と信頼性も向上し、大規模なリポジトリでの長時間作業や、複雑なリファクタリング、コード移行、機能実装といったタスクを、計画変更や試行失敗があっても確実に完了できるようになった。
サイバーセキュリティ能力において、GPT-5.2-Codexは過去のどのモデルよりも強力な性能を示している。2025年12月11日、PrivyのAndrew MacPherson氏がCodex CLIとGPT-5.1-Codex-Maxを使用し、React Server Componentsに影響する3件のセキュリティ脆弱性を発見した事例が注目を集めた。
同氏は別のReact脆弱性React2Shellの調査中、ゼロショット分析から反復的プロンプト手法へ移行し、最終的にローカルテスト環境の構築、攻撃対象領域の検討、ファジングによる検証という標準的な防御的セキュリティワークフローでCodexを活用した。

この過程でわずか1週間のうちに未知の脆弱性が発見され、すべて責任ある形でReactチームに報告された。プロレベルのCapture-the-Flag評価では、GPT-5-Codex以降段階的な性能向上が確認されており、GPT-5.2-Codexは現時点でサイバー能力「High」レベルには達していないが、将来的な能力向上を見据えた安全対策を実装している。
提供形態として、本日より有料ChatGPTユーザー向けにCodexのすべての環境でGPT-5.2-Codexの提供を開始し、数週間以内にAPIユーザーへも安全にアクセスを提供する予定だ。
並行して、責任ある脆弱性開示の実績を持つ審査済みセキュリティ専門家や、明確な業務上のサイバーセキュリティ用途を持つ組織を対象に、招待制のtrusted accessパイロットを導入する。

本プログラムでは、防御的ユースケースにおいて正当なデュアルユースの業務を行えるよう、最も高い能力を持つモデルへのアクセスと今後の機能を提供する。セキュリティ専門家は専用フォームから参加の意向を表明できる。
ビジョン性能の強化により、GPT-5.2-Codexはコーディング中に共有されるスクリーンショット、技術図、チャート、UI画面をより正確に解釈できるようになった。Codexはデザインモックを迅速に機能するプロトタイプへ変換し、開発者との連携によりこれらを本番環境へ進めることが可能だ。
OpenAIは、能力向上に対してより強固な安全対策、厳格なアクセス制御、セキュリティコミュニティとの継続的な連携を組み合わせ、段階的な提供と安全対策により防御面での効果を高めつつ悪用のリスクを抑えることを目指している。
AI Market の見解
GPT-5.2-Codexは、エージェント活用型AIコーディングツールが専門的なソフトウェアエンジニアリング領域において実用レベルに達したことを示す重要なマイルストーンだ。
特に注目すべきは、ネイティブなコンテキスト圧縮技術により長時間の複雑な作業でも推論効率を維持できる点で、これは従来のコーディングアシスタントが抱えていたコンテキストウィンドウの制限を実質的に克服する技術的進歩と想定される。
SWE-Bench ProとTerminal-Bench 2.0での最先端性能は、理論的な能力だけでなく現実的なソフトウェア開発ワークフローでの実効性を裏付けている。
サイバーセキュリティ領域での能力向上は、AIの両刃の剣としての性質を明確に示している。実際にプロのセキュリティ研究者がわずか1週間で未知の脆弱性を発見できた事実は、防御側の作業を大幅に加速する可能性を証明する一方、同じ能力が攻撃側に悪用されるリスクも高まることを意味する。
OpenAIがtrusted accessという段階的提供モデルを採用した判断は、技術の社会実装における責任ある展開手法として評価できる。審査プロセスを経た専門家のみに高度な機能へのアクセスを許可する仕組みは、今後のデュアルユース技術の提供モデルとして一つの参考となると想定される。
参照元:OpenAI
GPT-5.2-Codexに関するよくある質問まとめ
- GPT-5.2-Codexと従来のGPT-5.2やGPT-5.1-Codex-Maxとの主な違いは何か?
GPT-5.2-Codexは、GPT-5.2の基盤的な能力にエージェント活用型コーディング向けの最適化を加えたモデルだ。
主な違いとして、ネイティブなコンテキスト圧縮により長時間の作業でも推論効率を維持できる点、大規模なリファクタリングやコード移行での性能向上、Windows環境でのパフォーマンス改善、そしてサイバーセキュリティ機能の大幅な強化が挙げられる。ベンチマークでは、SWE-Bench Proで56.4%、Terminal-Bench 2.0で64.0%を記録し、従来モデルを上回る最先端性能を達成している。
- trusted accessパイロットプログラムに参加するにはどうすればよいか?
trusted accessパイロットは、責任ある脆弱性開示の実績を持つ審査済みのセキュリティ専門家、または明確な業務上のサイバーセキュリティ用途を持つ組織を対象とした招待制プログラムだ。脆弱性研究や認可されたレッドチーミングなどの倫理的なセキュリティ活動に取り組む専門家または組織の一員は、OpenAIが提供する専用フォームから参加の意向を表明できる。参加者には、防御的ユースケースにおいて最も高い能力を持つモデルへのアクセスと今後の機能が提供される。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
