Googleが次世代AIモデル「Veo 2」「Imagen 3」を発表、画像生成実験ツール「Whisk」も米国で提供開始
最終更新日:2024年12月17日

2024年12月16日(現地時間)、GoogleはAIによる動画生成モデル「Veo 2」と画像生成モデル「Imagen 3」の最新版を発表した。
両モデルは人間による評価において最先端の結果を達成し、VideoFXやImageFX、新しい実験ツール「Whisk」で利用可能となる。Veoは最大4K解像度での動画生成が可能で、シネマトグラフィーの表現にも対応。また、Imagen 3は写実的な表現から印象派、アニメまで多様なアートスタイルを生成できる。
新ツールのWhiskは、画像入力により簡単に視覚的なアイデアを実現できるツールとして米国で提供を開始する。
<本ニュースの10秒要約>
- 最大4K解像度の動画生成が可能な「Veo 2」の登場により、物理法則や人の動きの表現が向上し、シネマトグラフィー表現も実現
- 「Imagen 3」は写実的表現からアニメまでの多様なスタイルに対応し、より鮮やかで構図の整った画像生成を実現
- 画像入力により直感的な生成が可能な新ツール「Whisk」を米国で提供開始、GeminiとImagen 3を組み合わせた技術を採用
Veo 2の特徴と機能
Veo 2は、物理法則や人の動きの表現において大幅な改善を実現した。シネマトグラフィーの言語を理解し、レンズの種類やシネマティックエフェクトの指定に対応する。最大4K解像度での動画生成が可能で、数分の長さまで対応する。
ローアングルのトラッキングショットや科学者の顔のクローズアップなど、具体的な撮影表現にも対応し、18mmレンズによるワイドアングルショットや被写界深度の浅い表現なども実現できる。安全性への配慮から、SynthIDによる不可視の透かしを出力に含め、AIによる生成であることを示す。
Imagen 3の進化と利用可能性
Imagen 3は、より鮮やかで構図の整った画像を生成できるようになった。写実的な表現から印象派、抽象的なものやアニメまで、多様なアートスタイルをより正確に表現できる。
プロンプトへの忠実な対応が向上し、より豊かな細部とテクスチャの表現が可能となった。ImageFXを通じて100カ国以上で利用可能となり、誰でも簡単に高品質な画像生成を体験できる。
新ツール「Whisk」の特徴と可能性
Whiskは、画像入力により被写体やシーン、スタイルを伝えることができる新しい実験ツールだ。GeminiとImagen 3を組み合わせた技術により、Geminiが画像の詳細なキャプションを自動生成し、それをImagen 3に送信することで、独自の作品を生成できる。
デジタルぬいぐるみやエナメルピン、ステッカーなど、様々な形式での出力が可能だ。
AI Market の見解
GoogleのVeo 2とImagen 3の発表は、生成AIの実用化に向けた重要な一歩と言える。特にVeo 2による高品質な動画生成は、映像制作のワークフローを大きく変革する可能性がある。
また、Whiskの導入は、専門知識がなくても直感的に生成AIを活用できる未来を示唆している。透かし技術の採用は、生成AI技術の社会実装における責任ある開発姿勢を示すものだ。今後、これらの技術は広告制作やコンテンツ制作の分野で広く活用され、クリエイティブ産業に大きな影響を与えると予測される。
参照元:Google

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
