OpenAIが独自タスク遂行を可能にするエージェント構築のための新しいAPIとツールセットを発表
最終更新日:2025年03月12日

OpenAIは2025年3月11日(現地時間)、ユーザーに代わって独自にタスクを達成するエージェントを構築するための初めての包括的ツールセットを発表した。
この新しいツールセットには、Chat CompletionsとAssistants APIの機能を組み合わせた新しい「Responses API」、ウェブ検索やファイル検索、コンピュータ操作などの組み込みツール、単一および複数エージェントのワークフローを調整するための「Agents SDK」、そしてエージェントワークフローの実行を追跡・検査するための統合監視ツールが含まれている。
- OpenAIのChat CompletionsとAssistant APIの機能を統合した「Responses API」の導入により、開発者が少ないコードでモデルとツールを組み合わせたエージェント構築が可能に
- ウェブ検索、ファイル検索、コンピュータ使用(マウスとキーボードの自動操作)という三つの組み込みツールにより、AIエージェントが外部情報やシステムと連携できる能力を強化
- オープンソースの「Agents SDK」が複数エージェント間のワークフロー調整、安全性確保、実行追跡を簡素化し、CoinbaseやBoxなどの企業がすでに実用システムに導入
OpenAIによると、過去1年間で高度な推論、マルチモーダルインタラクション、新しい安全技術などの新しいモデル機能を導入し、エージェントの構築に必要な複雑なマルチステップタスクを処理するための基盤を築いてきた。
しかし、顧客からのフィードバックによれば、これらの機能を本番環境で使用可能なエージェントに変換することは、十分な可視性や組み込みサポートなしに広範なプロンプト反復とカスタムオーケストレーションロジックを必要とすることが多く、課題となっていた。
この課題に対応するため、新しいResponses APIは、組み込みツールを含むエージェントを構築するための新しいAPI基盤として設計されている。
このAPIは、シンプルなインターフェースでありながら、複数のツールやモデルターンを使用して複雑なタスクを解決できる柔軟性を提供する。Responses APIはすべての開発者が利用可能で、トークンとツールは標準レートで課金される。
新しく導入されたツールのうち、ウェブ検索ツールは最新で正確な回答を明確で関連性の高い引用とともにウェブから提供する。GPT-4oとGPT-4o-miniモデルで利用可能で、SimpleQAベンチマークではそれぞれ90%と88%の精度を達成している。
ファイル検索ツールは、複数のファイルタイプをサポートし、クエリ最適化、メタデータフィルタリング、カスタム再ランキングを備え、迅速で正確な検索結果を提供する。初めの1GBは無料で、それ以降は1日あたりGBあたり0.10ドルの料金で利用可能だ。
コンピュータ使用ツールは、同社のOperatorを支えるのと同じComputer-Using Agent(CUA)モデルを活用し、マウスとキーボードのアクションを生成してコンピュータ操作タスクを自動化する。
このツールは、ブラウザベースのワークフローの自動化やレガシーシステム間のデータ入力タスクの実行など、さまざまな用途に使用できる。UnifyやLuminaiなどの企業はすでにこのツールを活用して、以前はAPIを通じてアクセスできなかった情報にアクセスしたり、複雑な運用ワークフローを自動化したりしている。
また、開発者はエージェンティックワークフローを調整するための新しいオープンソースのAgents SDKも利用できるようになった。このSDKは、昨年リリースされた実験的なSwarm SDKの改良版で、エージェント、ハンドオフ、ガードレール、トレースと可観測性などの機能を備えている。
このSDKは、カスタマーサポートの自動化、複数ステップの研究、コンテンツ生成、コードレビュー、セールスの見込み客開拓など、さまざまな実世界のアプリケーションに適している。例えば、CoinbaseはAgents SDKを使用してAgentKitを迅速にプロトタイプ化し、デプロイした。
これにより、AIエージェントが暗号ウォレットやさまざまなオンチェーンアクティビティとシームレスにやり取りできるようになった。BoxはわずかSか日でウェブ検索とAgents SDKを活用するエージェントを作成し、企業がBox内に保存されている非構造化データをパブリックインターネットソースから検索、クエリ、洞察を抽出できるようにした。
AI Market の見解
OpenAIの今回のエージェント構築ツール群の発表は、AIエージェント市場の成熟と実用化への重要なステップを示している。特に注目すべきは、従来は個別に存在していた機能(チャット、ツール使用、多段階推論)を統合したResponses APIの導入と、実世界のシステムとの連携を可能にする組み込みツールの充実だ。
ウェブ検索やファイル検索は情報の文脈理解を、コンピュータ使用機能はデジタル環境での直接的な行動能力をエージェントに付与する。これにより、単なる対話型AIから実際のタスク遂行者へとAIの役割が拡張される可能性が高まっている。
また、Agents SDKのオープンソース化と標準化されたワークフロー構築支援は、エコシステムの発展と企業導入の加速に寄与すると想定される。Coinbaseやboxなどの具体的な実装事例が示すように、これらのツールは既存のシステムやプロセスと統合して実用的な価値を生み出すための障壁を下げている。
参照元:OpenAI
OpenAIのエージェント構築ツールに関するよくある質問まとめ
- Responses APIとAssistants APIの違いは何ですか?
Responses APIはChat CompletionsとAssistants APIの機能を統合した新しいAPIで、より柔軟性が高く、使いやすく、高速に動作します。AssistantsのAPIベータ版からのフィードバックに基づいて改良されており、組み込みツール(ウェブ検索、ファイル検索、コンピュータ使用)をサポートしています。OpenAIは2026年中頃にAssistants APIを廃止する予定で、完全な機能パリティと移行ガイドを提供する予定です。
- コンピュータ使用ツールはどのような安全対策がありますか?
OpenAIはコンピュータ使用ツールの安全性を確保するために、プロンプトインジェクションに対するセーフティチェック、機密タスクの確認プロンプト、環境分離のツール、ポリシー違反の検出強化など複数の対策を実施しています。ただし、モデルはまだ不注意なミスに影響されやすく、OSWorld ベンチマークでの現在の性能は38.1%であり、オペレーティングシステム上のタスク自動化にはまだ高い信頼性がないため、人間による監視が推奨されています。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
