OpenAI、これまでで最も高性能なO3とO4-miniモデルをリリース
最終更新日:2025年04月17日

OpenAIは2025年4月16日、これまでで最も高性能なO3とO4-miniモデルをリリースしたと発表した。
これらの新モデルは長く考えてから回答する推論モデルシリーズの最新版で、ウェブ検索、ファイル分析、視覚情報処理、画像生成など、ChatGPT内のすべてのツールに対応する初のモデルとなっている。
従来のO1と比較して複雑な問題解決能力が大幅に向上し、約1分以内に詳細な思考プロセスを示す回答を生成できる。
- O3とO4-miniは、数学・コーディング・科学・視覚理解などで最高性能を発揮する推論特化型AIモデルで、ベンチマークテストでも大幅な性能向上を実現
- 両モデルはChatGPTのウェブ検索・ファイル分析・視覚情報処理・画像生成など全ツールを活用可能で、複雑な問題に対して適切なツール選択と連携が可能
- 新モデルは既存のO1・O3-miniと比較して同じレイテンシーとコストで高性能を実現し、ChatGPT Plus・Pro・Teamユーザーは即日利用可能
O3とO4-miniは、OpenAIの推論モデルシリーズの最新版で、回答前により長く思考するように訓練されている。O3は最も強力な推論モデルとして、コーディング、数学、科学、視覚認識など幅広い分野でこれまでにない性能を発揮する。
具体的には、Codeforces、SWE-bench、MMMUなどの主要ベンチマークで最高記録を達成している。特に視覚タスクにおいて優れた性能を示し、画像、チャート、グラフィックスなどを分析する能力が向上している。
外部の専門家による評価では、O1と比較して複雑な実世界のタスクにおけるエラー率が20%減少し、特にプログラミング、ビジネス/コンサルティング、創造的なアイデア生成の分野で優れた成績を収めた。
初期テスターからは思考パートナーとしての分析能力が高く評価され、特に生物学、数学、エンジニアリングの文脈で新しい仮説を生成し批判的に評価する能力が際立っているとのフィードバックがあった。
一方、O4-miniはサイズとコストに対して最適化された小型モデルで、高速かつコスト効率の良い推論が可能だ。
特に数学、コーディング、視覚タスクにおいて、そのサイズとコストを考慮すると驚異的な性能を発揮する。AIME 2024と2025のベンチマークでは、評価されたモデルの中で最高の成績を記録した。
専門家の評価では、前身のO3-miniと比較して、STEM以外のタスクやデータサイエンスなどの分野でも優れた性能を示した。高い効率性により、O3よりも大幅に高い使用制限をサポートしており、推論を必要とする質問に対して高いスループットで処理できる強力なオプションとなっている。
両モデルともに、ウェブソースの活用により、前世代のモデルと比較して指示に従う能力が向上し、より有用で検証可能な回答を提供する。また、過去の会話を参照してより個人化された関連性の高い回答を生成するため、より自然な会話体験を提供する。
両モデルの主な特徴として、ChatGPT内のすべてのツールへのフルアクセスが可能になり、APIを通じた独自のカスタムツールも利用できる。これらのモデルは問題の解決方法について推論し、いつどのようにツールを使用して詳細で思慮深い回答を適切な出力形式で、通常は1分以内に生成するよう訓練されている。
例えば、ユーザーが「カリフォルニアの夏のエネルギー使用量は昨年と比較してどうなるか」と質問した場合、モデルはウェブ検索で公共事業データを検索し、Pythonコードで予測を構築し、グラフや画像を生成して、予測の背後にある主要な要因を説明するなど、複数のツール呼び出しを連携させることができる。
また、初めて画像を思考のチェーンに直接統合できるようになり、視覚的および文字テキストの推論を融合させた新しいクラスの問題解決が可能になった。
これにより、ホワイトボード、教科書の図、手書きのスケッチなどの画像を解釈することができ、たとえそれが不鮮明、反転、低品質であっても対応できる。
AI Market の見解
OpenAIのO3およびO4-miniモデルの発表は、AIの推論能力に重点を置いた進化を示している。
特に注目すべきは、モデルが単に質問に答えるだけでなく、複数のツールを組み合わせて複雑な問題解決プロセスを実行できる点だ。これは、AIがより自律的なエージェントとして機能する方向への重要なステップと位置付けられる。
技術的には、強化学習の規模をGPTのプレトレーニングと同様に拡大し、計算能力と推論時間を1桁増加させた点が画期的と言える。ビジネス面では、同じコストとレイテンシーでより高い性能を提供することで、企業ユーザーとデベロッパーに対してより効率的なAIソリューションを提供している。
市場への影響としては、OpenAIのこの動きは企業向けAI市場における競争を激化させ、特に視覚情報と文字情報を統合した推論能力の向上が、データ分析、研究開発、カスタマーサービスなどの分野での応用範囲を拡大すると想定される。
また、Codex CLIの発表は、プログラマー向けの新たなツールセットを提供し、開発者エコシステムの強化につながる可能性が高い。
参照元:OpenAI
O3とO4-miniに関するよくある質問まとめ
- O3とO4-miniの一般ユーザーはどのように利用できますか?
ChatGPT Plus、Pro、Teamユーザーは即日から利用可能で、モデルセレクターでO3、O4-mini、O4-mini-highを選択できます。これらは従来のO1、O3-mini、O3-mini-highに代わるものです。
ChatGPT EnterpriseとEduユーザーは1週間後にアクセスできるようになります。無料ユーザーはクエリを送信する前にコンポーザーで「Think」を選択することでO4-miniを試すことができます。すべてのプランでのレート制限は以前のモデルセットから変更されていません。
- O3とO4-miniの主な技術的違いは何ですか?
O3は最も強力な推論モデルで、特にコーディング、数学、科学、視覚認識分野で最高性能を発揮します。O4-miniはサイズとコストに最適化された小型モデルで、AIME 2024/2025などの数学コンペティションで最高の成績を記録しています。
両モデルとも全ツールアクセスをサポートし、画像を思考プロセスに統合できる点が新しい特徴です。技術的には、強化学習を大規模に適用し、AIが「考える」時間を増やすほど性能が向上し続けることを実証しています。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
