Meta、世界モデル「V-JEPA 2」を発表。ゼロショットロボット制御と物理推論ベンチマークを公開
最終更新日:2025年06月26日

Meta社は2025年6月11日、動画から物理世界を理解・予測する世界モデル「V-JEPA 2」を発表した。
12億パラメータのこのモデルは、未知の環境と物体に対してゼロショットでロボット計画と制御を可能にし、同時に物理推論評価のための3つの新しいベンチマークも公開された。
- Meta社が動画学習による世界モデル「V-JEPA 2」を発表、ゼロショット環境でのロボット制御を実現
- 100万時間超の動画データで事前学習後、わずか62時間のロボットデータで行動予測機能を獲得
- 物理推論能力評価のため「IntPhys 2」「MVPBench」「CausalVQA」3つのベンチマークを新規公開
V-JEPA 2は、Meta社が開発した12億パラメータの世界モデルで、Joint Embedding Predictive Architecture(JEPA)を基盤としている。
このモデルは動画から物理世界の法則を学習し、未来の状況を予測する能力を獲得する。
従来のロボット基盤モデルが特定のロボット環境でのトレーニングデータを必要とするのに対し、V-JEPA 2は汎用的な動画データから学習した知識を直接新しい環境に適用できる点が特徴だ。
モデルはエンコーダとプレディクタの2つの主要コンポーネントから構成され、エンコーダが生の動画から有用な意味情報を抽出し、プレディクタが文脈情報を基に将来の状態を予測する。
学習プロセスは2段階に分かれている。第1段階では100万時間超の多様な動画データと100万枚の画像を用いた自己教師あり学習を実施し、人と物体の相互作用や物理法則を学習する。
この段階でSomething-Something v2での動作認識やEpic-Kitchens-100での動作予測において最先端性能を達成した。第2段階では、わずか62時間のロボットデータを用いて行動条件付き学習を行い、特定の行動を考慮した予測能力を獲得する。
これにより、ロボットは現在の状態から目標状態に向けて複数の候補行動の結果を予測し、最適な行動を選択できるようになる。
実用性能では、新しい環境での物体の取得と配置タスクにおいて65%から80%の成功率を達成している。短期タスクでは目標画像を指定し、長期タスクでは複数の視覚的サブゴールを順次達成する方式を採用している。
また、ロボットは各時間ステップで再計画を行い、モデル予測制御を通じて最適な次の行動を実行する。
この手法により、訓練時に見たことのない物体や環境においても効果的に動作できることが実証された。物理推論能力の評価を目的として、Meta社は3つの新しいベンチマークを公開した。
IntPhys 2は物理的に妥当なシナリオと不合理なシナリオを区別する能力を測定し、MVPBenchは動画言語モデルの物理理解能力を多肢選択問題で評価する。
CausalVQAは因果関係の理解、特に反実仮想や予測、計画に関する質問への回答能力を測定する。
人間はこれらのベンチマークで85%から95%の精度を達成するが、現在の最先端モデルは大幅に下回る性能を示しており、改善の余地が大きいことが明らかになった。
AI Marketの見解
V-JEPA 2の発表は、AI分野における世界モデル研究の重要な進展を示している。
特に注目すべきは、大規模な動画データからの自己教師あり学習と少量のロボットデータによる追加学習を組み合わせたアプローチで、データ効率性と汎用性を両立させた点だ。
従来のロボット学習では環境固有のデータが大量に必要だったが、この手法により異なる環境間でのゼロショット転移が可能になり、ロボティクスの実用化を大幅に加速すると想定される。
技術的観点では、JEPAアーキテクチャの有効性が実証されたことで、予測学習による世界理解の可能性が確認された。
しかし、人間との性能差が大きいベンチマーク結果は、現在のAIが物理世界の複雑な因果関係や長期的な予測において課題を抱えていることを示している。
参照元:Meta
V-JEPA 2に関するよくある質問まとめ
- V-JEPA 2はどのような環境で動作するのか?
V-JEPA 2は訓練時に見たことのない新しい環境や物体に対してもゼロショットで動作できる。DROID データセットで学習したモデルを異なるロボット環境に直接適用でき、物体の取得や配置などの基本タスクを実行できる。
- 従来のロボット基盤モデルとの違いは何か?
従来モデルは特定のロボット環境でのトレーニングデータが必要だったが、V-JEPA 2は汎用的な動画データから学習した知識を直接新環境に適用できる点が大きく異なる。また、わずか62時間のロボットデータで行動予測能力を獲得できる高いデータ効率性も特徴だ。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
