Google次世代AI「Gemini 2.0」が本格始動。マルチモーダル出力とエージェント機能が搭載
最終更新日:2025年01月05日
2024年12月11日(現地時間)、GoogleはAIモデル「Gemini 2.0」を発表した。昨年12月に発表したGemini 1.0から進化を遂げ、テキスト、画像、音声、コードなどのマルチモーダル入力に加え、画像生成や音声合成などの出力機能を新たに搭載。
さらに、ユーザーに代わってタスクを実行する「エージェント機能」を強化し、Project AstraやProject Marinerなどの実証実験も開始した。開発者向けに実験版の提供を開始し、2025年1月から一般提供を予定している。
<本ニュースの10秒要約>
- 従来の2倍の処理速度と画像生成・音声合成機能を備えた新AIモデル「Gemini 2.0 Flash」の実験版提供開始
- ブラウザ操作や音声対話を自律的に行うAIエージェントProject MarinerとProject Astraの実証実験開始
- 開発者向けマルチモーダルライブAPIの提供開始とGeminiアプリでの実験版モデルの一般利用開始
Gemini 2.0の主要機能と特徴
Gemini 2.0 Flashは、従来のGemini 1.5 Proの2倍の処理速度を実現しつつ、より高いパフォーマンスを達成した。新たに画像生成や多言語音声合成などのマルチモーダル出力機能を搭載し、Google検索やコード実行、サードパーティー機能の呼び出しにも対応した。
開発者向けには新しいマルチモーダルライブAPIを提供し、リアルタイムの音声・動画入力と複数ツールの組み合わせが可能になった。
AIエージェント研究プロジェクトの展開
GoogleはGemini 2.0を基盤として、複数のAIエージェント研究プロジェクトを開始した。Project Astraは多言語対話や10分間のセッションメモリ機能を備えたAIアシスタントで、グラス型デバイスでのテストも予定している。
Project Marinerは実験的なChromeプラグインとして、ブラウザ上での複雑なタスク実行を支援する。さらに、開発者向けのコードエージェント「Jules」やゲーム支援AIなど、様々な領域での実験を進めている。
安全性と責任ある開発への取り組み
Googleは新技術の開発に際し、安全性とセキュリティを重視している。社内の責任・安全性委員会(RSC)と連携し、潜在的なリスクの特定と理解に努めている。
Gemini 2.0の推論能力を活用して、リスク検出だけでなく、評価データの自動生成と対策の最適化を行う。また、Project AstraやProject Marinerでは、個人情報保護や悪意のある指示の防止など、具体的な安全対策を実装している。
AI Market の見解
Gemini 2.0の発表は、AIモデルが単なる情報処理から自律的なタスク実行へと進化する転換点を示している。特に、マルチモーダル出力機能とエージェント機能の統合は、AIアシスタントの実用性を大きく向上させる可能性を持つ。
Project MarinerやProject Astraなどの実証実験は、AIエージェントの実用化に向けた具体的なユースケースを提示しており、今後のAI市場の方向性を示唆している。ただし、安全性とプライバシーの確保が普及の鍵となるため、Googleの段階的なアプローチは適切な戦略といえる。
参照元:Google
AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp