GoogleがGemini 3を発表、最高性能の推論能力とマルチモーダル理解を実現したAIモデル
最終更新日:2025年11月19日

Googleは2025年11月18日、同社史上最も高性能なAIモデルGemini 3を発表した。
Gemini 3 ProはLMArenaで1501 Eloを記録してトップに立ち、PhD レベルの推論能力を示すHumanity’s Last Examで37.5%、GPQA Diamondで91.9%を達成し、マルチモーダル理解とエージェント機能において新たな水準を確立している。
- Gemini 3 ProがLMArenaで1501 Eloを記録し、主要AIベンチマークすべてでGemini 2.5 Proを大幅に上回る性能を達成
- Gemini 3 Deep Thinkモードを導入し、Humanity’s Last Examで41.0%、ARC-AGI-2で45.1%という未到達の推論性能を実現
- エージェント開発プラットフォームGoogle Antigravityを発表し、Gemini 3の推論能力を活用した自律的なソフトウェア開発環境を提供
Gemini 3 Proは、Google DeepMindが開発した最新のAIモデルであり、推論能力とマルチモーダル理解において業界最高水準の性能を達成している。LMArenaリーダーボードでは1501 Eloという突破的なスコアを記録し、トップの座を獲得した。

学術的な評価においても、Humanity’s Last Examでツールを使用せずに37.5%、GPQA Diamondで91.9%を達成し、PhD レベルの推論能力を実証している。
数学分野ではMathArena Apexで23.4%という新記録を樹立し、マルチモーダル推論ではMMU-Proで81%、Video-MMUで87.6%を記録した。事実精度を測るSimpleQA Verifiedでは72.1%を達成し、複雑な科学・数学問題を高い信頼性で解決できることを示している。

Gemini 3 Deep Thinkモードは、Gemini 3の推論能力とマルチモーダル理解をさらに高度化した強化推論モードだ。このモードでは、Humanity’s Last Examで41.0%、GPQA Diamondで93.8%を達成し、すでに高性能なGemini 3 Proを上回る結果を示した。
特筆すべきは、ARC-AGI-2においてコード実行を用いて45.1%という前例のないスコアを記録したことで、これは新規の課題を解決する能力が飛躍的に向上したことを意味する。
Gemini 3 Deep Thinkは、Google AI Ultraサブスクライバー向けに数週間以内に提供される予定で、現在は安全性テスターによる評価が進められている。
Googleは、Gemini 3の高度な推論能力、ツール使用能力、エージェントコーディング機能を活用した新しいエージェント開発プラットフォーム、Google Antigravityを発表した。
このプラットフォームは、開発者がタスク志向の高いレベルで作業できるよう設計されており、AIアシスタンスを開発者のツールキットの一部から能動的なパートナーへと変革する。
Google Antigravityのエージェントは、エディター、ターミナル、ブラウザへの直接アクセスを持ち、複雑なエンドツーエンドのソフトウェアタスクを自律的に計画・実行し、自らのコードを検証できる。
Gemini 3は、WebDev Arenaリーダーボードで1487 Eloを記録し、Terminal-Bench 2.0で54.2%、SWE-bench Verifiedで76.2%を達成し、コーディングエージェントとしての優れた能力を実証している。
Gemini 3は、長期的な計画実行能力においても大幅な進歩を遂げている。Vending-Bench 2では、シミュレートされた自動販売機ビジネスを1年間運営し、一貫したツール使用と意思決定を維持しながら高い収益を生み出すことでリーダーボードのトップに立った。
この能力により、Gemini 3は複雑な複数ステップのワークフローを最初から最後まで遂行できる。実用例として、地域サービスの予約やメール受信箱の整理など、日常生活のタスクをユーザーの管理とガイダンスのもとで代行できる。
Google AI Ultraサブスクライバーは、GeminiアプリでGemini Agentを通じてこれらのエージェント機能を試すことができ、今後さらに多くのGoogle製品に展開される予定だ。
Gemini 3は、Google AI StudioやVertex AI、Gemini CLI、さらにCursor、GitHub、JetBrains、Replit などのサードパーティプラットフォームでも利用可能となっている。
AI Market の見解
Gemini 3は、GoogleのAI開発における技術的な集大成として位置づけられる。特に注目すべきは、推論能力の飛躍的な向上とマルチモーダル理解の深化だ。LMArenaで1501 Eloという業界トップのスコアを達成したことは、対話型AIの品質において新たな基準を確立したことを意味する。
PhD レベルの推論能力を示すベンチマーク結果は、専門的な知識領域においてもAIが実用的なパートナーとして機能し得ることを示唆している。
ビジネス的観点では、Google Antigravityの導入が開発者エコシステムに与える影響は大きいと想定される。
エージェントがエディター、ターミナル、ブラウザを自律的に操作し、エンドツーエンドのソフトウェア開発タスクを実行できることは、開発生産性の大幅な向上につながる。SWE-bench Verifiedで76.2%という高スコアは、実際のソフトウェア工学タスクにおける実用性を裏付けている。
市場への影響として、Gemini 3の登場は企業向けAI活用の加速を促すと想定される。Googleの発表によれば、Cloud顧客の70%以上がすでにAIを利用しており、1300万人の開発者が生成モデルを活用している。
Gemini 3の性能向上は、これらの既存ユーザーベースにおける活用範囲の拡大と、新規導入企業の増加を促進すると考えられる。特に、長期的な計画実行能力の向上は、業務自動化やワークフロー最適化において実用的な価値を提供し、企業のAI投資対効果を高める要因となる。
また、Gemini 3がリリース初日からGoogle検索に統合される点は、数十億人のユーザーに最新AI技術が即座に届けられることを意味し、AIの社会実装における新たなモデルを示している。
参照元:Google
Gemini 3に関するよくある質問まとめ
- Gemini 3はどのような製品やサービスで利用できるのか?
Gemini 3は2025年11月18日から、Geminiアプリ、AI Mode in Search、Google AI StudioやVertex AIなどの開発者向けプラットフォーム、新しいエージェント開発環境Google Antigravity、さらにCursor、GitHub、JetBrains、Replitなどのサードパーティプラットフォームで利用可能となっている。Google AI ProおよびUltraサブスクライバーは追加機能にアクセスでき、Gemini 3 Deep Thinkモードは安全性評価を経て数週間以内にGoogle AI Ultraサブスクライバー向けに提供される。
- Gemini 3 Deep Thinkモードとは何か?
Gemini 3 Deep Thinkモードは、Gemini 3の推論能力とマルチモーダル理解をさらに高めた強化推論モードだ。通常のGemini 3 Proよりも複雑な問題解決に優れており、Humanity’s Last Examで41.0%、GPQA Diamondで93.8%、ARC-AGI-2で45.1%という高度なベンチマークスコアを達成している。このモードは特に複雑な課題や新規の問題に対する解決能力が求められる場面で威力を発揮する。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
