Stable Diffusionのモデルとは?どこでダウンロード?おすすめモデル9選も徹底解説!
最終更新日:2024年11月17日
Stable Diffusionのモデルとは、画像生成AIのStable Diffusionでオリジナルの画像を生成するための学習済みファイルを指します。Stable Diffusionのモデルを変更することで、事前学習されたデータに応じてアニメ風や写真風など、様々な画像を生成することができます。
ChatGPTの登場以降、生成AIに関する注目が非常に大きくなり、さまざまな企業から生成AIのサービスが登場しました。Stable DiffusionはStability AI社が2022年8月にリリースし、画像生成AIサービスの中でも特に人気のあるサービスとなっています。
Stable Diffusionの概要、ビジネス利用の方法をこちらの記事で詳しく説明していますので併せてご覧ください。
今回は
AI Marketでは
目次
Stable Diffusionのモデルとは?
Stable Diffusionのモデルとは、画像生成AIのStable Diffusionでオリジナルの画像を生成するための学習済みファイルを意味します。
Stable Diffusionをブラウザで利用する際に使われるDreamStudioには、すでに画像生成AIモデル(Stability AI社の提供するSDXL)が組み込まれており、テキスト入力だけで画像生成できます。誰でも簡単に画像生成でき、複雑なコードの記述やハイスペックなマシンの準備も必要ありません。
Stable Diffusionによる画像生成は、ディープラーニングに基づく深層生成モデルである拡散モデルを採用しています。この技術により、従来の機械学習手法を超える高度で精密な画像を生成することが可能です。
さらに、モデルを自身で追加学習すると、より自分好みの画像を簡単に生成できます。これは、Stable Diffusionがオープンソースであるからこそできる便利な機能であり、Stable Diffusionが広がった重要なポイントです。
Stable Diffusion以外の画像生成AIサービスでは、システム内に組み込まれているモデルを変更できない、または技術的にハードルが高いのが現状です。例えば、ChatGPTもDALL・E 3を内部に組み込んで画像生成できますが、モデルの変更やファインチューニングはできません。
Stable Diffusionモデルの追加学習の必要性
Stable Diffusionモデルを追加学習することには以下のメリットがあります。
尚、前提として、Stable Diffusionには、ブラウザベースで画像を生成することが可能なDreamStudioと、ローカルのパソコンなどにダウンロードして追加学習など様々なカスタマイズが可能なWebUIがあります。
追加学習などを行いたい際は、ローカル環境(またはGoogle Colab等)を利用する必要がありますので、注意が必要です。
特定の画像スタイルや内容をより正確に反映させる
モデルの追加学習は、ユーザーが求める特定の画像スタイルや内容をより正確に反映させるために不可欠です。これにより、個々のユーザーが独自に用意した学習データを活用してAIを訓練し、求める画像の特徴を正確に反映させた結果を得ることができます。
例えば、アニメ風イラストに特化したモデルを追加することで、細かな指定をせずともアニメスタイルの高品質な画像を簡単に生成できます。また、img2imgという機能でアップした画像を元に全く新しい画像を生成することもできます。加えて、構図や背景など画像の具体的な要素を制御するControlNetという拡張機能もあります。
モデルをマージできる
異なるモデルの「マージ」により、各モデルの長所を組み合わせ、より高品質でユニークな画像を生み出すことが可能です。この技術は、ユーザーが自分の好みや必要に応じて、カスタマイズされたAI画像を生成する過程を大きく促進します。
特に、アニメ系イラストの生成では、スタイルや雰囲気の指定なしで、直感的に望むクオリティのイラストを得られることが特徴です。
また、モデルのマージを利用して、既存のモデルデータを組み合わせた新しいモデルの作成も可能です。ユーザーは2つのモデルを合成する比率を自由に設定でき、これにより、さらに個性的な画像生成が実現します。
Stable Diffusionでモデルを追加することは、画像生成の精度を高め、ユーザーの具体的なニーズに対応するための強力な手段です。企業がこれを事業活用することで、ブランドイメージを強化し、顧客エンゲージメントを高めることが期待できます。
関連記事:「モデルマージとは?SAKANA AIの進化的モデルマージで変わる世界・手順・課題を徹底解説!」
Stable Diffusion WebUIは日本語で使える?
Stable Diffusion WebUIはデフォルトは英語表示ですが、拡張機能を利用すれば日本語に変換することができます。「stable-diffusion-webui-localization-ja_JP」という拡張機能をインストールすればStable Diffusionの表示を日本語にすることができます。
また、「sd-webui-bilingual-localization」という拡張機能は2か国同時に表示する拡張機能で、日本語と英語どちらも表示させたいという方におすすめです。
Stable Diffusionで使えるモデルをダウンロードできるサイトは?
Stable Diffusionで使えるモデルをダウンロードできるサイトはHugging FaceやCivitaiというサービスが代表的です。
それぞれに異なる特徴があるため、ここでは概要と特徴について解説していきます。自分の生成したい画像を作るためにぜひチェックしていきましょう。
Hugging Face
Hugging FaceはStable DiffusionをはじめとしてさまざまなAIモデルや学習に使うデータセットを共有しているプラットフォームです。当初は開発者向けに公開されており、研究者や開発者がデータセットなどをHugging Faceで公開し、他のユーザーがそれらを利用して開発を進めたりしています。
Hugging Faceはチャットボットなど自然言語処理のモデルや画像認識モデルなど様々なモデルが提供されており、Stable Diffusionで利用できるモデルやデモも多く公開されています。ただし、Hugging Face上のデモなどではStable Diffusionでできるような高度なパラメータ設定はできないため、自身でパラメータの調整したいという場合は注意しましょう。
Civitai
Civitaiとは、Stable Diffusion用のモデルの投稿、ダウンロードが可能なプラットフォームです。クオリティが高いモデルをアカウント作成不要かつ無料でダウンロードできます。画像生成AIのモデルの数に関して、Hugging Faceよりも多く画像生成に特化していることが特徴です。
Stable Diffusionのモデル以外にもLoRAやVAEなどもダウンロードできます。さまざまなデータをダウンロードできますが、シンプルな画面操作で完結するため、画像生成AIの分野でとても注目されています。
- LoRA:特定のモデルに対して追加学習を行ったファイルまたはツール。
例えば、既存のモデルに対して、特定の服装や背景のLoRAを追加学習させ、モデルを好きなようにアレンジする使い方ができます。 - VAE:画像生成の精度向上のためのモデル。画像のくすみやボケを簡単に補正できます。
AI Marketでは
Stable Diffusionで利用可能なおすすめモデル9選
Stable Diffusionで利用できるモデルは非常にさまざまな種類があります。
それぞれ生成できるモデルの特徴が違うため、より自分好みなモデルを選ぶためにはよりたくさんのモデルに触れていくことが重要です。ここでは代表的なおすすめモデルをベースモデルと合わせて紹介していきます。
尚、多くのモデルは、Stable Diffusionのオープンソースモデル(特に人気のモデルはSD1.5)をベースに、追加学習を行い、モデルとして提供されているということを押さえておきましょう。
Stable Diffusion 3.5
Stable Diffusion 3.5は、Stability AI社が提供するモデルのなかで最も強力なモデルで、2024年10月に提供開始されました。2024年11月現在で最新のこのモデルは、Stable Diffusion 3.5 LargeやStable Diffusion 3.5 Large Turboなど様々なバリエーションが含まれています。
Stability AI Community Licenseの下で、商業利用、非商業利用ともに無料で利用することができるだけでなく、APIによる利用も可能となっています。
SDXL
SDXLは、Stable Diffusion XLの略語で、Stability AI社が提供するモデルです。2023年7月に提供開始されました。1,024×1,024という高解像度の画像が出力できる特徴を持っており、様々な画像を生成することが可能です。
また、公式にStability AI社が提供しているモデルということもあり、商用利用が可能となっています。
SDXL-Turbo
SDXL-TurboはSDXL 1.0の改良版で、より高い品質の画像を出力することができます。2023年11月に提供開始されました。
こちらのモデルも、商用利用が可能となっています。
yayoi_mix(ベースモデル:SD 1.5)
yayoi_mixはリアルなAI美女に強いモデルです。リアル系のモデルが複数組み合わさっており、アジア系の人物に強く細かな手先の描写なども崩れず生成される特徴があります。
商用利用は可能ですが制限されている項目もあるため、事前にチェックしておきましょう。
Beautiful Realistic Asians(ベースモデル:SD 1.5)
Beautiful Realistic Asians(BRA)もリアルなAI美女に特化しており、アジア系の特徴をもつ人物の画像生成に適しています。実写に近い精度でAI写真集によく利用されています。
商用利用は一部可能で、生成した画像の販売等も可能ですが、マージモデルの販売は禁止されています。
CityEdgeMix(ベースモデル:SD 1.5)
CityEdgeMixはアジア系女性中心の画像生成モデルで、制服やユニフォームを着ている女性を得意としています。VAEがすでに組み込まれているため、追加で設定する必要はありません。
商用利用は制限されており、CityEdgeMixを利用した画像の販売などは禁止されています。
HimawariMix(ベースモデル:SD 1.5)
HimawariMixはアニメ系のモデルで、フラットなデザインを得意としています。複数のモデルが組み合わさっており、背景など細部まで高精度に表現されます。VAEはあらかじめ組み込まれているため、設定不要です。
商用利用は制限付きで可能です。
Anime Pastel Dream(ベースモデル:SD 1.5)
Anime Pastel Dreamはアニメやイラスト風の画風に強いモデルです。VAEはあらかじめ組み込まれているため、設定不要です。
商用利用は可能ですが、自身でマージしたモデルの販売などは禁止されているので注意しましょう。
Anything
Anything v5(ベースモデル:SD 1.5)
Anything v5はアニメ風の画像生成を得意としているモデルです。イラスト系のanythingシリーズのひとつで、アニメ塗りというタッチの画像に特化しています。
さまざまなバージョンが展開されているため、さまざまなタッチの画像を生成できるモデルが展開されていることも特徴です。
商用利用に関する制限がないため、生成した画像の自由度が高い特徴があります。
Anything XL(ベースモデル:SDXL 1.0)
Anything XLは2024年11月現在の時点で最新のモデルです。
MeinaUnreal(ベースモデル:SD 1.5)
MeinaUnrealはリアルなアニメタッチの画像生成を得意としています。色彩のグラデーションなどが綺麗で他のアニメ系のモデルにない画風が特徴です。
商用利用は生成した画像の販売は認められていますが、ノンクレジットでモデルを使用することは禁止されているなど制限付きです。
blue_pencil(ベースモデル:SD 1.5)
blue_pencilはアニメ風のキャラクターを得意としており、細部まで制度の高い画像生成できるモデルです。
商用利用は可能ですがライセンスによる規定があるため、利用したい場合は必ず目を通しておく必要があります。
配布されているStable Diffusionのモデルは商用利用できる?
Stability AI社の提供する公式のStable Diffusionモデル(SD1.5やSDXL等)は基本的に商用利用できます。Creative ML OpenRAIL-Mというライセンスによって運営され、これはStable Diffusionなどで利用されるAIモデルを対象とする特殊なライセンスです。ただし、追加学習を行ったモデルによっては、商用利用を制限していたり、マージモデルの販売を禁止するなどさまざまなケースが存在しています。
例えば、Civitaiでは配布しているモデルごとに商用利用できるかの利用規約が設定されています。それぞれのモデルやLoRAの詳細を表示すると、Licenseが表示されています。
Licenseには、商用利用できるか以外に、クレジット記載の必要性があるか、ダウンロードしたモデルを使って新しく生成したモデルは同じ条件を適用すべきかなどさまざまな項目が存在します。
商用利用する際はそのモデルのライセンスは必ず確認しておく必要があります。また、Civitai以外ではサイト特有の規定やサイト上で利用できるか規定されていることもあるので注意しましょう。
Stable Diffusionのモデルについてよくある質問まとめ
- Stable Diffusionのモデルとは?
Stable Diffusionのモデルとは、画像生成AIのStable Diffusionでオリジナルの画像を生成するための学習済みファイルを意味します。モデルを自身で追加学習すると、より自分好みの画像を簡単に生成することができます。Stable Diffusionはオープンソース化されているため、ユーザーが各自で用意した学習データをAIに読み込ませることができます。
まとめ
今回はStable Diffusionのモデルについて、概要やダウンロードするサイト、おすすめのモデルまで解説してきました。Stable Diffusionのモデルとは画像生成AIのStable Diffusionでオリジナルの画像を生成するための学習済みファイルを指します。Stable Diffusionはモデルをユーザー自身が変更できるため、さまざまなモデルを利用して生成したい画像により近づけることができます。
公開されているモデルは非常にたくさんあるので、今回紹介したおすすめモデルなどを参考に、生成したい画像のモデルを探してみることもおすすめです。ぜひ、今回の内容をきっかけにAI導入の検討をしていきましょう。
AI Marketでは
AI Market 運営、BizTech株式会社の代表取締役です。2021年にサービス提供を開始したAI Marketのコンサルタントとしても、お客様に寄り添いながら、お客様の課題ヒアリングや企業のご紹介を実施しています。AI Marketの記事では、AIに関する情報をわかりやすくお伝えしています!
𝕏:@ymorishita
BizTech株式会社HP:https://www.biz-t.co.jp/