最終更新日:2024-06-14
Stability AI社、新たな画像生成モデル「Stable Diffusion 3 Medium」をオープンモデルとして公開
Stability AI社は、2024年6月12日、新たな画像生成モデル「Stable Diffusion 3 Medium」をオープンモデルとして公開した。
「Stable Diffusion 3 Medium」は、20億のパラメータで構成された画像生成モデルであり、サイズが小さいため個人向けシステムや企業向けGPUでの動作に向くという特徴を持つ。公開時点では、非商用ライセンスで利用が可能となっている。
<本ニュースの10秒要約>
- 世界中で多くの支持を獲得してきた画像生成モデル「Stable Diffusion」の最新版
- 個人向けシステムや企業向けGPUで動作させるのに最適な20億パラメータモデル
- オープンモデルとして公開、フィードバックに基づいて継続的に改善や機能拡張を図る
画像生成AIモデル「Stable Diffusion」を展開するStability AI社
Stability AI社は、AIを民主化して人類の可能性を活性化するためのグローバルな基盤を構築すべく、2019年よりAI事業を展開している企業だ。2022年には、ユーザーが入力したテキストに基づいて画像を生成するAIモデル「Stable Diffusion」を発表。一般消費者向けのハードウェアでも処理が可能な「Stable Diffusion」は多くの支持を獲得し、同社は世界中で30万人以上のクリエイター/開発者/研究者のコミュニティも形成している。
同社は、「AIを人々の、人々による、人々のためのツールにすること」を目標と定めており、開発したモデルについてもオープン性に強くこだわっている。AIモデルの信頼/透明性/革新性/完全性を育むためにも
、同社はオープン性へのコミットメントを推進。新たなモデルである「Stable Diffusion 3 Medium」もまた、「パワフルなテクノロジーを民主化する」という同社の姿勢に基づき、オープンモデルとして公開されるに至った。
最新かつ最も高度な画像生成モデル「Stable Diffusion 3 Medium」
「Stable Diffusion 3 Medium」は、Stability AI社が2024年2月に発表した「Stable Diffusion 3」の20億パラメータモデルであり、同社にとっては最新かつ最も高度な画像生成モデルとなる。サイズが小さいため、個人向けシステムや企業向けGPUで動作させるのに最適な構成となっている。
同モデルでは、生成の全体的な品質とフォトリアリズムが向上し、ディテール/カラー/ライティングに優れた高品質な画像を柔軟なスタイルで出力できるようになった。手/顔のリアルさなども、16チャンネルVAEなどの工夫によって向上している。
プロンプトの理解能力も、同モデルは向上した。空間的推論/構成要素/アクション/スタイルを含む長くて複雑なプロンプトも理解し、3つのテキストエンコーダーを活用することでパフォーマンス/効率のトレードオフにも対応している。また「Stable Diffusion 3 Medium」は、小さなデータセットから微妙なディテールを理解するファインチューニングも実現。テキスト生成の品質向上や、一般消費者向けGPUでの効率的な動作なども可能にした。
新たな無償のクリエイターランセンスで公開
Stability AI社は「Stable Diffusion 3 Medium」を、新たな無償のクリエイターランセンス「Stability Non-Commercial Research Community License」の下でリリースした。オープンモデルとして公開することで同社は、アーティスト/デザイナー/開発者/AI愛好家の活用を奨励すると同時に、AIをオープンでアクセス可能な状態に保つというミッションの実現を目指す。
今後同社は、ユーザーからのフィードバックに基づいて同モデルを継続的に改善し、機能拡張やパフォーマンス向上を図るとしている。
参照元:Stability AI社
生成AI(ジェネレーティブAI)について詳しく知りたい方はこちらの記事もご参考ください。
AI Market ニュース配信チームでは、AI Market がピックアップする厳選ニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひTwitterもフォローしてみてください!また、AI Market でニュースを配信したいという方はこちらよりお問い合わせください。