Microsoft、汎用マルチエージェントシステム「Magentic-One」を発表、複数のAIエージェントが協調して複雑なタスクを解決
最終更新日:2024年11月11日
Microsoftは2024年11月4日、複数のAIエージェントが協調して複雑なタスクを解決する汎用マルチエージェントシステム「Magentic-One」を発表した。
オープンソースフレームワークのMicrosoft AutoGen上で実装され、Orchestratorと呼ばれるリードエージェントが他の4つの専門エージェントを指揮して、ウェブやファイルベースのタスクを実行する。同社は実装コードをGitHubで公開し、研究者や開発者がアクセス可能だ。
目次
<本ニュースの10秒要約>
- Orchestratorが指揮を執り、WebSurfer、FileSurfer、Coder、ComputerTerminalの4つの専門エージェントが協調して複雑なタスクを遂行
- 複数の最新ベンチマークでSOTAと同等以上の性能を達成し、汎用エージェントシステムとしての高い実用性と拡張性を実証
- オープンソースでの公開とAutoGenBenchの提供により、研究コミュニティ全体でのエージェントAIの発展と安全性向上を促進
システム構成と特徴
Magentic-Oneは、Orchestratorと呼ばれるリードエージェントを中心に、WebSurfer、FileSurfer、Coder、ComputerTerminalの4つの専門エージェントで構成される。
Orchestratorは外部ループと内部ループの2つのループを実装し、タスク台帳で事実や推測、計画を管理しながら、進捗台帳で現在の進捗状況とエージェントへのタスク割り当てを管理する。
下記の動画は、同社が公開しているサンプル動画だ。「S&P500のトレンドを解説」というタスクに対して、Orchestratorが進捗を管理しながら、様々な解析を行っていることがわかる。
各専門エージェントはウェブブラウジング、ファイル操作、コード作成、プログラム実行などの特定の役割を担い、モジュール性と柔軟性の高いシステムを実現した。
性能評価と実証結果
Microsoftは評価ツール「AutoGenBench」を開発し、GAIA、AssistantBench、WebArenaの3つのベンチマークでMagentic-Oneの性能を検証した。
その結果、GAIAとAssistantBenchで既存の最高性能システムと統計的に同等の性能を達成し、WebArenaでも競争力のある性能を示した。
特に、システムのコア機能やアーキテクチャを修正することなく、複数のベンチマークで高いパフォーマンスを実現したことが特徴だ。
リスクと対策
開発過程で、ウェブサイトへの過度なログイン試行によるアカウント一時停止や、人間のヘルプを求めようとするなどの予期せぬ動作が確認された。
これに対しMicrosoftは、有害なコンテンツ、ジェイルブレイク、プロンプトインジェクション攻撃に対するレッドチーミング演習を実施し、安全な使用のためのガイダンスを提供している。
また、実行環境の分離やログ監視、最小権限の原則など、具体的な対策を実装した。
AI Market の見解
Magentic-Oneは、単一のAIモデルによる処理から複数のAIエージェントの協調へと、AIシステムの設計パラダイムを転換する重要な一歩だ。オープンソース化により、エージェントAIの研究開発が加速すると共に、安全性や倫理面での議論も活発化するだろう。
特に、人間とAIの協調の在り方や、AIシステムの自律性の範囲について、産業界全体で新たな指針が求められる。Microsoftによる包括的なリスク対策アプローチは、今後のAIエージェント開発における重要な参考事例となる。
参照元:Microsoft
生成AI(ジェネレーティブAI)について詳しく知りたい方はこちらの記事もご参考ください。
AIに関するご相談はAI Marketへ
AI Marketでは
メルマガ会員登録(無料)
AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp