Stable Diffusionとは?なぜ商用利用におすすめ?種類・選び方・メリット・ビジネス活用方法・実際の出力例・注意点を解説!
最終更新日:2024年11月14日
「画像生成AIで思い通りの画像を作る方法が知りたい」、「デザインや画像制作にかかる時間を削減したい」と悩んでいる方も多いのではないでしょうか。
本記事では、画像生成AIの一つとして注目されている
特に、商用利用する際に注意すべき点を重点的に解説しているので、ビジネスでの利用を考えている方は、本記事を参考に活用方法を考えてみてください。
生成AI(ジェネレーティブAI)とは?どんな種類がある?といった重要疑問の答えをこちらの記事で詳しく説明していますので併せてご覧ください。
AI Marketでは
目次
Stable Diffusionとは?
Stable Diffusionとは、テキスト情報から画像を作り出す高性能の画像生成AIの一つです。イギリスのスタートアップであるStability AI社が開発しました。
どのような画像を生成したいのかを、日本語や英語などの自然言語で入力するだけで、指示通りの画像を生成します。Stable Diffusionはオープンソース化されており、無料で利用可能です。
Diffusionモデルとは?
出典:Denoising Diffusion Probabilistic Models. Ho et al.
Stable Diffusionでは、名前の一部にもなっている拡散モデル(Diffusionモデル)を活用して画像を生成しています。Stable Diffusionを始めとする画像生成AIは、テキスト情報を画像に変換するAIでText to Imageとも呼ばれています。画像生成AIには、これまでVAEやGANなどの手法がよく用いられてきましたが、2022年以降頃から拡散モデルが主流となり始めています。
AIによる画像生成の仕組み詳細をこちらの記事で詳しく説明していますので併せてご覧ください。
Stable Diffusionが用いるDiffusionモデルでは、上記画像のように完全なノイズ画像から少しずつノイズを乗り除くことにより、目的の画像を作成します。
Stable Diffusion以外の有名な画像生成AIには、以下のようなものがあります。
- DALL·E 3
- Midjourney
- Adobe Firefly
- NovelAI
画像生成AIはビジネスに活用できる?
出典:お~いお茶 カテキン緑茶シリーズ「伊藤園」
基本的に、画像生成AIはビジネスに活用できます。特にStable Diffusionは公式規約でも商用利用がきちんと認められているため、ビジネス目的で活用する企業も出てきています。
実際に、画像生成AIをCMに活用した例もあります。上記の画像は、清涼飲料水メーカーである伊藤園が「お~いお茶 カテキン緑茶」のCMにAIタレントを起用したものです。
「お~いお茶 カテキン緑茶」では、AIタレントを起用したほか、パッケージのデザインも画像生成AIを参考にしているようです。
同広告ではデザイナーが修正を行っているようですが、AIタレントを採用したことにより撮影の手間が大幅に省けたと考えられます。
広告業界での画像生成AI活用事例をこちらの記事で詳しく説明していますので併せてご覧ください。
AIの活用体制が整っていない段階では、一時的に従来より手間とコストがかかる可能性もあります。それでも、AI活用体制の構築や画像生成AIの精度向上が進めば、業務の効率化が図れるようになります。
そのため、画像生成AIなどの生成AI活用を早期から始めることは、将来の企業価値を高めることに繋がるでしょう。
Stable Diffusionの使い方
Stable Diffusionは、Webサイトとローカル環境で利用できます。ここでは、それぞれの環境での使い方を解説します。
Webサイト上で使う
Stable Diffusionを利用できるWebサイトはいくつかあります。
- Hugging Face
- Dream Studio
- Mage
ここでは、Hugging FaceでStable Diffusionを利用します。まず、Hugging Faceにアクセスします。
「Enter your prompt」に指示文を入力します。prompt(プロンプト)とは、機械への指示文です。どのような画像を生成して欲しいのかを入力しましょう。
その下の「Enter a negative prompt」には、出力してほしくない特徴を入力します。
ここでは「東京タワーの下に立つ一人の日本人男性。写真風、リアルに」と入力(英語)します。ネガティブプロンプトには「アニメ風、低品質」と入れました。
その結果、以下の画像が出力されました。
このように、簡単に無料で希望通りの画像を生成できました。今回はざっくりとした指示をしたため、統一感のない環境やアングルの画像が生成されましたが、さらに細かい指示を加えることにより、思い通りの画像に近づけることが可能です。
また、Stable Diffusionを提供するStability AI社が公式に提供しているDream Studioでは、より高精度な画像を生成することも可能です。(無料範囲内で無料使用可能)
ただし、ビジネス目的で利用するには、より高品質でオリジナルの画像が必要になるかもしれません。その場合は、次に紹介するローカル環境を用いて、自社にカスタマイズしたモデルの活用がおすすめです。
ローカル環境で使う
ローカル環境でStable Diffusionを利用すれば、自社に適した機能を追加できます。Stable Diffusionのコードはオープンソースのため、誰でも無料で利用可能です。Python、git、Stable Diffusionをダウンロードすることで利用できるようになります。ローカル環境で利用するStable Diffusionの代表的な環境には、初心者でも使いやすいAUTOMATIC1111(Web UI)やノードUIで拡張性の高いComfyUIがあります。
初めにシステムを構築する手間が少しかかりますが、ビジネス目的で画像生成AIを活用したい方や、高品質でオリジナルな画像を生成したい方は、ローカル環境でStable Diffusionを利用すると良いでしょう。APIも公式で準備されています。
ローカル環境でStable Diffusionを利用するには、PC上でシステムを動かさなければなりません。そのため、動作に耐えうるスペックを持っているPCを利用しましょう。2023年12月時点では以下のスペックがあれば動作すると考えられます。(Google Colabで動かす方法もありますが、今回はローカル環境で動かす方法をご紹介します。)
- メモリ:16GB以上(32GBは欲しい)
- VRAM:12GB以上
弊社調査では、MacよりもWindowsの利用がおすすめと思われます。Macでは画像生成速度が遅く、メモリを過剰に消費する傾向にあるようです。
AI Marketでは
Stable Diffusionの5つのメリット
Stable Diffusionを利用することにより、以下のメリットを享受できます。
- オンプレミスで高セキュリティ運用が可能
- 目的に合わせてカスタマイズ可能
- 無料で利用できる
- 商用利用できる
- 生成した画像の修正が可能
それぞれのメリットを解説します。
オンプレミスで高セキュリティ運用が可能
Stable Diffusionは、企業が自身の物理的な施設内にITインフラストラクチャを設置し、オンプレミスで管理可能です。ですから、企業側でセキュリティ対策を自ら設計し実施できます。
オンプレミスでStable Diffusionを運用する場合、画像生成のプロセス全体が組織内のサーバー上で行われます。これにより、生成された画像やそれを生成するために使用されるデータが組織の外部に送信されることがなくなり、プライバシーが保護されます。
機密データの扱いが重要な組織や、厳格なデータ保護規制の遵守が求められる環境において、特にメリットが大きいと言えます。オンプレミスでの運用により、データ漏洩のリスクを軽減し、機密性を維持することが可能です。
目的に合わせてカスタマイズ可能
Stable Diffusionは、ローカル環境でカスタマイズしたり、モデルを取得して追加学習することにより、目的に最適化させたモデルにすることができます。この自由度の高さがStable Diffusionを事業利用するための最大のメリットと言えるでしょう。
例えば、「DreamBooth」で追加学習を行えば、オリジナルな生成モデルを構築できます。また、「Lora」を用いれば、非常に少ない計算量で追加学習を行うことが可能です。そのほか、ControlNetを使えば、構図や人物のポーズを指定することもできます。
これらの機能を目的に応じて導入すれば、イメージした画像をより簡単に作り出すことが可能です。これは他の画像生成AIにはない機能です。例えば、ChatGPTも内蔵のDALL・E 3を活用して画像生成できますが、ユーザー側でモデルのカスタマイズはほとんどできません。
無料で利用できる
Stable DiffusionはWebサイトでもローカル環境でも無料で利用できます。DALL·E 3(OpenAI社の提供するChatGPT(GPT-4)の中で利用可能)のように有料会員にならないと画像を生成できないサービスもある中で、無料で利用できるのは大きなメリットです。
イラスト作成のほか、生成画像の微調整や修正まで無料で行えます。さらに、画像生成AIは指示された内容をすぐに実行できます。
そのため、イラストレーターに発注するよりも安価かつ短時間で画像を作成可能です。
商用利用できる
Stable Diffusionで生成した画像は商用利用できます。
The Output You Generate. Except as set forth herein, Licensor claims no rights in the Output You generate using the Model. You are accountable for the Output you generate and its subsequent uses. No use of the output can contravene any provision as stated in the License.
引用:LICENSE「Stability AI CreativeML Open RAIL++-M License dated July 26, 2023」
翻訳すると、「本ライセンスにおいて、あなたがモデルを使用して生成する出力について、ライセンサーは権利を主張しません。あなたは、生成した出力とそのその後の使用について責任を負います。出力の使用は、本ライセンスに記載されているいかなる規定にも違反することはできません。」となります。
ただし、商用利用する際は、ライセンスに違反しないよう注意しなくてはなりません。ライセンスには、以下のような画像は生成、共有しないよう記載されています。
- 適用法または規制に違反する方法で使用する画像
- 個人に危害を加える画像
- 他人を中傷、誹謗、またはその他の形で嫌がらせをする画像
- 医療や医療結果の解釈を提供する画像
特に、ビジネスで利用する際には、一度ライセンスを読んでから利用するようにしてみてください。
また、上述したWebUIを活用すると、Stability AI社が提供していない個人が作った生成モデルを活用することもできます。この際、そのモデルが「商用利用できないモデル」である可能性もあるため注意が必要です。これはそのモデルが著作権で保護されている画像をもとにトレーニングされている場合などが該当します。
生成した画像の修正が可能
Stable Diffusionでは、画像の生成のほか、画像の修正も可能です。画像は「inpaint」という機能を用いることで修正できます。
Stable Diffusionでは、画像全体の修正だけでなく、部分的な修正も可能です。修正したい部分を塗りつぶして指示することで、その部分のみを修正してくれます。
ほかにも、「outpainting」という機能を用いれば、画像の外側をAIが予測して付け足してくれます。画像を切らずにアスペクト比を変更したい場合に有効です。
また、img2imgという機能でアップした画像を元に全く新しい画像を生成することもできます。加えて、ポーズや構図など画像の具体的な要素を制御するControlNetという拡張機能もあります。
Stable Diffusion利用時の注意点
Stable Diffusionを利用する際には、以下の3点に注意する必要があります。
- 著作権や肖像権を侵害するリスクがある
- 同じプロンプトで同じ画像が生成させるとは限らない
- プロンプトスキルがないと低品質な画像になる
それぞれについて解説します。
著作権や肖像権を侵害するリスクがある
Stable Diffusionに限らず、画像生成AIの利用には著作権や肖像権の侵害リスクがあります。特に、商用利用する際には、会社の信用を落とさないためにも細心の注意が必要です。
画像生成AIを利用して法律が問題となった例に、集英社のAIグラビア書籍『生まれたて。』があります。同社の編集部は問題点を明らかにしていませんが、生成AIをとりまく様々な論点・問題点についての検討が十分ではなかったとして、2週間弱で販売を終了しました。
AIに関する法律は現在もあいまいな部分がありますが、会社で活用する際には、専門家に相談するなどの対応を取るようにしてみてください。
同じプロンプトで同じ画像が生成させるとは限らない
同じモデルに同じプロンプトを入力しても、同じ画像が生成されるとは限りません。これは、画像生成時にランダムに指定されるSeed値が異なるためです。
望み通りの画像が出力された際には、忘れずに画像やSeed値を保存するようにしてください。
また、Civitaiなどで配布されているプロ作成の高品質なモデルを活用することによって、一貫した画像生成は可能です。
プロンプトスキルがないと低品質な画像になる
Stable Diffusionで望み通りの画像を生成するためには、プロンプトスキルが必要です。プロンプトスキルとは、望み通りの画像を出力するために、適切なプロンプトを入力するスキルです。
思い通りの画像を生成するには、経験や知識が必要です。画像生成AIがうまく使いこなせない場合は、プロンプトスキルを身に着けてから、画像生成を試みるようにしてみてください。
プロンプトで生成画像がどのように変わるか代表的ツール別の解説をこちらの記事で詳しく説明していますので併せてご覧ください。
AI Marketの姉妹サービスであるPrompt Plusは、プロンプトエンジニアの作成した高品質なプロンプトを売買可能なプロンプトマーケットプレイスです。プロンプトの販売や購入にご興味のある方はぜひご覧ください。
プロンプトマーケットプレイス|Prompt Plus
センシティブな画像が生成される可能性がある
Stable Diffusionは、DALL·E 3やMidjourneyと比べて、出力できる画像の幅が広い傾向にあります。自由度が高いというメリットとも捉えられますが、センシティブな画像も生成されるという危険性も高いため注意が必要です。
特に、ビジネスでセンシティブな画像を利用してしまうと、イメージダウンや炎上のリスクが高くなります。ライセンスにはどのような画像生成が禁止されているかが記載されていますので、利用の際には一度読んでみると良いでしょう。
Stable Diffusionについてよくある質問まとめ
- Stable Diffusionとは?
Stable Diffusionとは、テキスト情報から画像を作り出す画像生成AIの一つです。どのような画像を生成したいのかを、日本語や英語などの自然言語で入力するだけで、指示通りの画像を生成します。
- Stable Diffusionのメリットは?
Stable Diffusionを利用することにより、以下のメリットを享受できます。
- 無料で利用できる
- 商用利用できる
- 目的に合わせてカスタマイズ可能
- 生成した画像の修正が可能
まとめ
Stable Diffusionは、画力がなくても思い通りの画像を生成できるAIです。活用次第では、画像制作にかかる時間やコストを大幅に削減できるだけでなく、これまで取り組めなかったような洗練されたデザインを柔軟に自社ビジネスに取り入れることができるようになるかもしれません。
Stable Diffusionでは、自社に合わせたモデルへ最適化できるため、画像制作をしている企業は業務効率化が図れるでしょう。
しかし、記事内で紹介した伊藤園などの大企業ではAIが普及していますが、中小企業では活用がまだまだ進んでいません。AIなどの先端技術を活用しないままいると、ノウハウや技術、競争力に差が生まれます。
Stable Diffusionは無料で利用を始められるので、AIを業務に活用したいと考えている方は、利用してみてはいかがでしょうか。
AI Marketでは
AI Marketの編集部です。AI Market編集部は、AI Marketへ寄せられた累計1,000件を超えるAI導入相談実績を活かし、AI(人工知能)、生成AIに関する技術や、製品・サービス、業界事例などの紹介記事を提供しています。AI開発、生成AI導入における会社選定にお困りの方は、ぜひご相談ください。ご相談はこちら
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
運営会社:BizTech株式会社
掲載記事に関するご意見・ご相談はこちら:ai-market-contents@biz-t.jp