MidjourneyのV1 Video Modelとは?動画生成機能の特徴・使い方・料金プランまで実際に使って検証解説!
最終更新日:2025年07月05日

- Midjourney V1 Video Modelは、画像を起点にアニメーションを加えて最大21秒の短尺動画を生成できる新機能。
- ローモーション/ハイモーションや自動・手動設定、外部画像の利用など柔軟な動画表現に対応。
- 動画生成には画像の約8倍のGPU時間を要するものの、1秒あたりのコストは画像1枚分と同等で、商用にも使える圧倒的コスパ。
2025年6月、Midjourneyが動画生成機能「V1 Video Model」を正式リリースしました。
これにより、従来の画像生成に加えて、生成画像やアップロード画像を起点にショートムービーを制作できるようになり、表現の幅が大きく広がります。
この記事では、V1 Video Modelでできること・主な機能、特徴、料金プラン、活用事例など公式発表に基づく情報をわかりやすく解説します。編集部で実際に使用した際のスクリーンショット解説、SNSで報告されている実際の活用事例もあるのですぐにMidjourneyの動画生成機能「V1 Video Model」を使える内容です。
AI Marketでは
目次
Midjourney V1 Video Model とは?
Midjourneyにとって、画像生成から映像生成への進化を実現する重要なアップデートであり表現の幅を着実に広げつつあります。
動画生成はすべてのプランでFastモードで行えます。ただし、Relaxモードでの動画生成はProおよびMegaプラン限定となっています。
参考:Midjourney:Introducing Our V1 Video Model
Midjourney V1 Video Modelの主な特徴
Midjourneyが満を持してリリースした初の動画生成機能「V1 Video Model」は、いくつかの際立った特徴を持っています。
- Image-to-Video
- 驚異的なコストパフォーマンス
- シンプルながらも表現豊かな操作性
- Webサイトに特化した使いやすさ
Midjourney V1 Video Modelは、テキストプロンプトから直接動画を生成するのではなく、Midjourneyが得意とする驚異的なクオリティの画像を基点として、それに動きを与えることで動画を生成します。
これにより、静止画で作り込んだ美しい世界観や細やかなディテールをそのまま動画に引き継ぐことが可能となり、一貫性のある高品質な映像表現を実現します。
次に、驚異的なコストパフォーマンスが挙げられます。動画生成には画像生成の約8倍のGPU時間を要するものの、1秒あたりの生成コストは画像1枚分と同等という業界でも類を見ない低価格を実現しています。
これにより、個人クリエイターから企業まで、予算を気にせず積極的に動画コンテンツ制作に取り組むことができます。
さらに、シンプルながらも表現豊かな操作性も魅力です。「ローモーション」と「ハイモーション」の2種類の動きの強さを選択できるだけでなく、生成した5秒の動画を最大4回まで延長できるため簡単な操作で物語性のあるショートムービーを制作できます。
そして、Discordを経由する必要がなく、Midjourneyの公式サイト上で直感的に操作できるため、より手軽に動画生成を始めることができます。
▼累計1,000件以上の相談実績!お客様満足度96.8%!▼
Midjourney V1 Video Model でできること・機能
Midjourney V1 Video Model でできること・主な機能は以下の通りです。
画像から動画を作る「Image-to-Video」機能
「Image-to-Video」は、画像を元に5秒間の動画を手軽に生成する機能です。Midjourneyが持つText-to-Image機能やImage-to-Image機能で生成した画像やアップロードした外部画像を「開始フレーム」として指定し、「Animate」ボタンを押すだけで動画を手軽に生成できます。
動画生成時には、「自動(Auto)」と「手動(Manual)」の2つのアニメーション設定が用意されています。
- 自動設定:AIがモーションプロンプトを自動生成して自然な動きを加える
- 手動設定:ユーザー自身が動き方やシーン展開を細かく指定することで、より自由で創造的な映像演出が可能になります。
モーションの強度を選べる
動画生成では、以下の2種類の動き方から選択できます。
- Low motion(ローモーション)
- High motion(ハイモーション)
以下は、「Low motion(ローモーション)」と「High motion(ハイモーション)」を比較した表です。
項目 | ローモーション(Low Motion) | ハイモーション(High Motion) |
---|---|---|
特徴 |
|
|
向いているシーン |
|
|
初期設定 | デフォルト(自動設定) | 明示的に指定が必要 |
注意点 | 被写体の動きが少なくなる可能性あり | 不自然・グリッチな動きが出るリスクあり |
モーション設定は、ウェブUI上の対応ボタンを使用するか、プロンプトの末尾に「–motion low」または「–motion high」 と指定することで調整できます。
動画の延長機能
最大4回まで(合計21秒まで)延ばすことができます。
1回の延長につき約4秒追加され、初期の5秒間からさらに延長することが可能です。これにより、物語性や演出を持たせたシーン構成が生成できます。
動画生成後は、Createページで動画にカーソルを重ねると「Extend Auto」と「Extend Manual」ボタンが表示されます。また、動画を開いた際にも「Creation Actions」セクションの下部に同様のオプションが用意されています。
- Extend Auto:元のプロンプトを保持したまま自動的に続きのシーンを生成する機能
- Extend Manual:プロンプトを変更したり要素を追加したりして、新たな内容を組み込んだ延長が可能
Extend Autoは、一貫性のある展開に最適で、Extend Manualは、より自由度の高い映像表現をしたい場合に適しています。
外部画像からの生成も対応
外部からアップロードした画像も使うことができます。
Midjourneyでは、外部からアップロードした画像もアニメーションの最初のシーンとして使うことができます。これにより、他のツールで作ったビジュアルや、過去に作成した画像も自由に活用できます。
動画生成時には、任意の画像を「開始フレーム」として設定することで、Midjourney上で動きを加えた動画コンテンツを簡単に制作できます。画像の再利用や複数プロンプトへの活用にも対応しており、オリジナリティのある映像制作に最適です。
このように、Midjourneyではアップロード画像も柔軟に扱えるため、過去に生成したビジュアルや他ツールで制作した素材も活用しながら、オリジナル性の高い動画コンテンツを構築できます。
▼累計1,000件以上の相談実績!お客様満足度96.8%!▼
Midjourney V1 Video Model の料金プラン
Midjourneyの動画生成機能は、サブスクリプションプランに応じて利用可能です。動画生成はすべてWeb版で提供されており、各プランの特徴は以下の通りです。
プラン名 | 年払い(月額) | 月払い | 主な特徴(動画関連) |
---|---|---|---|
ベーシックプラン | $8 | $10 | 月約200枚の画像生成に対応。 動画は1ジョブのみ同時実行可能。 |
スタンダードプラン | $24 | $30 | 15時間の高速生成に対応。 最大3件の動画ジョブを並列実行可能。 動画のリラックス生成は非対応。 |
プロプラン | $48 | $60 | 30時間の高速生成に対応。 最大6件の動画ジョブを同時実行可能。 動画のリラックス生成が無制限。 |
メガプラン | $96 | $120 | 60時間の高速生成に対応。 最大12件の動画ジョブを並列実行可能。 動画・画像のリラックス生成が無制限。 |
Proプラン以上では画像・動画の「リラックスモード」生成が無制限に利用可能となっており、並列ジョブ数や高速生成時間も大幅に拡張されています。
リラックスモードでは、Fast時間を消費せずに生成できる代わりに生成にやや時間がかかる仕組みです。
なお、画像のリラックス生成はStandardプランから利用可能ですが、動画のリラックス生成はPro以上に限定されています。動画制作を継続的に活用したいユーザーには、ProまたはMegaプランが適しています。
動画生成コストは業界最安水準
Midjourneyの動画生成は、従来のAI動画生成サービスと比較してと比べて約25分の1(Midjourney発表の比較数値)という極めて低コストです。1秒あたりの生成コストは「画像1枚分」と同等に抑えられているとMidjourneyはアピールしています。
従来の動画生成AIサービスの多くは、生成時間や解像度に応じてクレジットを消費するシステムを採用しており、月額$10〜$50程度のプランでは生成できる動画の総時間に限りがありました。MidjourneyのProプラン以上($60/月〜)を使えば、低速ながら動画生成が無制限になる「Relaxモード」が利用できます。
これは、商用利用から個人のクリエイティブ用途まで幅広く対応可能な価格設計となっています。
▼累計1,000件以上の相談実績!お客様満足度96.8%!▼
Midjourney V1 Video ModelとWhiskの比較
MidjourneyのV1 Video ModelとGoogleのWhiskはどちらも画像を起点に短尺動画を生成できるツールです。
Midjourneyが高品質な1枚の画像を起点にアニメ化するプロ・クリエイター向けツールなのに対し、Whiskは誰もが身の回りの素材をリミックス感覚で組み合わせ、手軽にショート動画を楽しむツールです。
専門性と作品の質を追求するMidjourney、手軽さと自由度のWhiskという違いがあります。
さらに、生成の流れや操作の自由度、料金体系に違いがあります。以下に、主な項目ごとの違いを整理しました。
項目 | Midjourney V1 Video Model | Google Whisk |
---|---|---|
生成ワークフロー | 画像を起点にアニメーションを追加 | 画像(被写体・背景・スタイル)に基づく自動アニメーション |
モーション設定 |
|
|
動画の長さ | 5秒+最大4回延長(最大21秒) | 最大21秒(Veo 2ベース) |
動画の生成方式 | 生成画像やアップロード画像を起点にアニメーション | スタイルと構成要素に基づき自動アニメーション |
料金体系 | 月額プラン制($10〜) |
|
操作の自由度 | 動き・構図・延長内容まで細かく制御可能 | 直感的操作で簡単に自動生成 |
Midjourney V1 Video Modelとwhiskの生成動画を実際に比較
実際にそれぞれのツールを使って動画を生成してみました。仕上がりの違いをご覧ください。
Midjourney V1 Video Model
動画生成AIは性能競争と用途の細分化
動画生成AIは性能競争と用途の細分化が急速に進んでいます。頂点に立つのは、テキストから写実的で一貫性のある長尺動画を生成するOpenAI「Sora」とGoogle「Veo」で、両者が業界の最高峰として覇権を争う構図です。
これに対し、先行するRunway Genシリーズ(Runway Gen-2、Runway Gen-4等)は多機能なツールとして広く利用され、新登場の「Midjourney」は得意とする高品質な画像からの動画化に特化するという独自のアプローチで差別化を図っています。
特定用途では、リアルなAIアバターが話す動画を手軽に作れるHeyGenがビジネス利用で独自の地位を確立。またGoogleは、Veoの技術を応用し、より手軽な動画作成ツールとしてWhiskを提供しています。
なお「Lumiere」や「Flow」は、現時点では特定製品というよりGoogleの研究開発段階の技術名と位置づけられます。
Midjourney V1 Video Modelを実際に触って分かる使い方
実際に使ってみた体験をもとに、ステップごとにわかりやすく解説します。
Step 0:画像生成前の設定
Midjourneyで動画を作成するには、まず公式ウェブサイトにアクセスして静止画を生成する必要があります。(別途アップロードした画像でも可能)
その前段階として、以下などの細かな設定を行うことができます。
- Image Size(画像サイズ)
- Aesthetics(美的表現)
- Model(バージョンやモード)
- Speed(生成スピード)
これらのパラメータは、画面右上のスライダー型アイコンをクリックすることで開く設定パネルから調整できます。目的や用途に応じて事前にチューニングしておくことで、より理想に近い映像生成が可能になります。
Step 1:画像を生成

まずは通常通りMidjourneyで静止画を作成します。
Step 2:「Animate」ボタンで動画化
作成した画像に対して「Animate」ボタンを押すと、動画生成処理が始まります。
Step 3:モーションの設定
アニメーションの動きは、「自動」と「手動」のいずれかで設定できます。自動設定ではAIが動きを自動的に調整し、手動設定ではプロンプトを使って細かく動き方を指定することが可能です。
Step 4:動きの強さを選択
アニメーションの動き方は、「ローモーション」と「ハイモーション」の2種類から選ぶことができます。シーンの内容や演出意図に応じて、適した動きの強度を設定してください。
ローモーションとハイモーションの比較
ローモーションとハイモーションの両方を試してみましたが、今回のケースでは動きに大きな違いは見られませんでした。
ローモーション
Step 5:動画の延長や外部画像の利用
今回は「雨が降ってきた」という内容をプロンプトに追加してみましたが、意図したような演出にはなりませんでした。ただし、動画内には地面に水たまりのような表現が現れており、「雨が降って、やんだ後の情景」であることはある程度伝わる仕上がりとなっていました。
さらに、外部からアップロードした画像も「開始フレーム」として利用できるため、過去に作成したビジュアルや他ツールで制作した素材を活用して動画化することも可能です。画像はプロンプトバーの「画像パネル」から選択し、開始フレームとして設定します。
Midjourney V1 Video Model の活用例
下記は、実際にXで投稿されている活用例です。
ファンタジーRPG風
This is INCREDIBLE! 🤯😃👏🏼
Thank you team @midjourney 🙏🏼🎉🙏🏼Midjourney V1 Video Model / Motion High / Extended pic.twitter.com/rHCHNwRS1B
— revelinai (@revelinai) June 18, 2025
キャラクター風
Midjourney’s V1 video model is so good with cartoon-style animations that it’s made something possible that used to be unthinkable: putting two fighters into battle.
Here’s Ryu vs Chun-Li 🥋⚡
And while the animation isn’t perfect (it’s extended), it’s still the best I’ve seen… pic.twitter.com/RxSURjcGQ2
— OscarAI (@Artedeingenio) June 19, 2025
人物風
Some test cases of the Midjourney V1 video model.
1.A solo dance performance with exceptional camera work and aesthetic. pic.twitter.com/7WV1ztnbBT
— 汗青 HQ (@hq4ai) June 19, 2025
Midjourney V1 Video Modelに関するよくある質問まとめ
- Midjourney V1 Video Modelは無料で利用できますか?
無料では利用できません。既存のMidjourneyのサブスクリプションプラン(ベーシックプラン月額8ドル〜)に加入する必要があります。
動画生成は画像生成の約8倍のGPU時間を消費しますが、1秒あたりのコストは画像1枚分と同等で業界最安水準となっています。
- 生成できる動画の最大長さはどれくらいですか?
初期生成では5秒の動画が作成され、その後最大4回まで延長が可能です。1回の延長につき約4秒追加されるため、最大21秒の動画を生成できます。
延長時は「Extend Auto」で自動継続するか、「Extend Manual」で新しい内容を追加することができます。
まとめ
Midjourney V1 Video Modelは、画像生成AIの進化系として、静止画に動きを加える機能を搭載しました。
これにより、ユーザーはこれまで以上に豊かな表現力を獲得でき、さらに将来的な3D表現やリアルタイム映像の基盤にもなることが期待されています。創造性を高めたいすべてのクリエイターにとって、極めて魅力的なアップデートです。
AI Marketでは

AI Marketの編集部です。AI Market編集部は、AI Marketへ寄せられた累計1,000件を超えるAI導入相談実績を活かし、AI(人工知能)、生成AIに関する技術や、製品・サービス、業界事例などの紹介記事を提供しています。AI開発、生成AI導入における会社選定にお困りの方は、ぜひご相談ください。ご相談はこちら
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
運営会社:BizTech株式会社
弊社代表 森下𝕏:@ymorishita
掲載記事に関するご意見・ご相談はこちら:ai-market-contents@biz-t.jp
