VaultGemmaとは?Google発のプライバシー保護LLMの性能や使い方、使ってみた結果まで徹底解説!
最終更新日:2025年10月04日

- VaultGemmaは2025年9月12日に公開された差分プライバシー(DP)でゼロから学習したLLMでプライベートAI開発の基盤となる
- プライバシーを優先したDP学習により、トレーニングデータの記憶や漏洩を防ぎ、厳格なプライバシー保証を提供する
- 性能は非DPモデルより一定のギャップがあり、GPT-2と同程度の水準
VaultGemmaは、Google ResearchとDeepMindの共同研究に基づき、「差分プライバシー(Differential Privacy, DP)」を備えたLLM(大規模言語モデル)として2025年9月12日にリリースされました。
高いプライバシー保守機能を数学的に保証するDPを適用したモデルの中でリリース時点で最大規模のものであり、研究者や開発者にとって次世代のプライベートAI開発のための重要な基盤となります。
本記事では、VaultGemmaの性能や使い方、実際に英語、日本語で入力して使ってみた結果までを徹底的に解説します。
LLMに強い会社・サービスの選定・紹介を行います 今年度LLM相談急増中!紹介実績1,000件超え! ・ご相談からご紹介まで完全無料 完全無料・最短1日でご紹介 LLMに強い会社選定を依頼する
・貴社に最適な会社に手間なく出会える
・AIのプロが貴社の代わりに数社選定
・お客様満足度96.8%超
・GPT、Claude、Gemini、Llama等の複数モデルに対応
目次
VaultGemmaとは?
Introducing VaultGemma, the largest open model trained from scratch with differential privacy. Read about our new research on scaling laws for differentially private language models, download the weights, & check out the technical report on the blog →https://t.co/tvgseWTcyP pic.twitter.com/caQyttLCnS
— Google Research (@GoogleResearch) September 12, 2025
VaultGemmaは、Google ResearchとDeepMindが共同で開発した「差分プライバシー(Differential Privacy, DP)」を備えたLLMです。プライバシー保護の仕組みを数学的に保証しており、まさに「金庫(Vault)」のように機密データを守りながら、その集合知から価値を引き出すことを可能にします。
約10億(1B)パラメータ規模でゼロから学習されたモデルであり、リリース時点で公開モデルとしては最大規模のDP訓練済みLLMとされています。
Hugging FaceやKaggle上で公開されており、実際に利用することが可能です。金融や医療といった機密データを扱う領域でも、安全にAIを活用する道を開きます。
GemmaファミリーにおけるVaultGemmaの位置づけ
VaultGemmaはGoogleが開発したオープンなAIモデルファミリー「Gemma」の一員です。
Gemmaは、Googleの最先端AI「Gemini」と同じ技術基盤から生まれた、軽量で高性能なオープンモデルシリーズです。用途に応じて様々なモデルがラインナップされています。
- Gemma: バランスの取れた汎用モデル。
- CodeGemma: コーディングに特化したモデル。
- PaliGemma: 画像とテキストの両方を扱えるマルチモーダルモデル。
- VaultGemma: プライバシー保護を最優先する用途に特化したモデル。
この中でVaultGemmaは、「セキュリティ」と「信頼性」という軸で独自の価値を提供します。これまでリスクの観点からAI活用が不可能だと考えられていた領域の扉を開く、極めて戦略的なモデルと言えるでしょう。
差分プライバシー(Differential Privacy, DP)とは
差分プライバシー(Differential Privacy, DP)は、学習時にランダムノイズを加えることで、モデルが特定のデータを記憶することを防ぐ技術です。これにより、プライバシーの保護を強化しながらLLMを学習させることが可能となります。
従来のAIモデルは、学習データに含まれる情報を”記憶”してしまう可能性がありました。これにより、特殊な質問(プロンプト)を投げかけることで、学習に使われた個人情報や機密情報が意図せず出力されてしまう「データ漏洩」のリスクが指摘されていました。
DPではモデルの学習段階で意図的に「ノイズ」を加えるなどの処理を施すことで、特定の個人や一件のデータが、AIモデルの学習結果に与える影響を数学的に極めて小さくします。
しかし、LLMに適用する場合、いくつかのトレードオフが生じます。具体的には、学習の安定性が低下しやすくなり、損失が急激に増える「発散」や「スパイク」が発生するリスクが高まります。また、従来よりも大幅に大きなバッチサイズと計算資源が必要となるため、訓練コストの増大が課題となります。
VaultGemmaのライセンス
VaultGemmaは、Googleが定める「Gemma Terms of Use(利用規約)」に基づいて提供されています。このライセンスは、一般的なオープンソースライセンスとは異なり、研究・開発での活用を促進しつつ、責任ある利用を求める形になっています。
利用用途 | 可否 |
---|---|
研究・開発目的での利用、改変、再配布 | 可能 |
生成したOutputの自由な利用 | 可能(権利は利用者に帰属) |
改変したモデルの配布(改変の明示が必須) | 可能 |
利用規約を提示したうえでの第三者への配布 | 可能 |
商用利用 | 明記されていない |
上記の利用用途でも、規約や法律に反する利用は禁止されているので、節度を守って利用しましょう。
詳しくは、Gemma Terms of Useをご確認ください。
LLMに強い会社・サービスの選定・紹介を行います 今年度LLM相談急増中!紹介実績1,000件超え! ・ご相談からご紹介まで完全無料 完全無料・最短1日でご紹介 LLMに強い会社選定を依頼する
・貴社に最適な会社に手間なく出会える
・AIのプロが貴社の代わりに数社選定
・お客様満足度96.8%超
・GPT、Claude、Gemini、Llama等の複数モデルに対応
VaultGemmaの性能
VaultGemmaは、従来のモデルと比較して一定の性能ギャップがあり、GPT-2などかつての非DPモデルと同程度の性能にとどまっています。

上記のグラフはVaultGemmaの1Bパラメータモデルは、Gemma 3 1BモデルやGPT-2 1.5Bとの比較を標準的なベンチマークを用いて行った結果です。SIQAやBoolQなどいくつかの指標で、Gemma-3に近い成績を残しています。
LLMに強い会社・サービスの選定・紹介を行います 今年度LLM相談急増中!紹介実績1,000件超え! ・ご相談からご紹介まで完全無料 完全無料・最短1日でご紹介 LLMに強い会社選定を依頼する
・貴社に最適な会社に手間なく出会える
・AIのプロが貴社の代わりに数社選定
・お客様満足度96.8%超
・GPT、Claude、Gemini、Llama等の複数モデルに対応
VaultGemmaの使い方
以下では、VaultGemmaを使うまでに必要な手順を一つ一つ解説します。
セットアップ
まず、Hugging FaceでVaultGemmaのアクセス承認を行う必要があります。VaultGemmaのページから、VaultGemmaへのアクセスを有効にしましょう。
Access Tokenの設定
次に、Access TokenをHugging Faceの設定から発行します。TokenのTypeはReadに設定すれば十分な権限を与えることができます。
次に、ターミナルで以下のコマンドを実行し、生成したトークンを貼り付けます。これにより、ローカルとHugging Faceを結びつけることができます。
huggingface-cli login
VaultGemmaのインストール
以下のコマンドを実行し、VaultGemmaのインストールを行いましょう。
pip install git+https://github.com/huggingface/transformers@v4.56.1-Vault-Gemma-preview
Pythonファイルの作成
次に、pythonファイルを作成し、以下のコードを入力します。
from transformers import pipeline
pipe = pipeline("text-generation", model="google/vaultgemma-1b")
prompt = input("プロンプトを入力:")
result = pipe(
prompt,
max_new_tokens=100,
temperature=0.5, # ランダム性の調整(小さいほど堅実、大きいほど創造的)
top_p=0.85, # nucleus samplingで多様性を確保
repetition_penalty=1.2 # 繰り返し抑制
)
print(result[0]["generated_text"])
このファイルを実行し、しばらくするとプロンプトの入力が求められます。
プロンプト入力
プロンプトを入力するとそれに対するVaultGemmaの回答が出力されるようになっています。
VaultGemmaを実際に使ってみた結果(日本語はパラメータ調整必要かも)
以下では実際に使ってみた結果をご紹介していきます。
Hello!と呼びかけ
まず、「Hello!」とプロンプトを入力してみました。
Hello!
I'm a native American with an English as a second language and I'm looking for an accommodation for a couple of days.
I'm looking for a place in a nice part of the country, preferably in an urban area, but I'm open to other options.
Price is $200/night.
This is my home for the rest of the time, if you're interested in an apartment in a neighborhood with a pool, a gym, I
Hello!への返答としては長すぎますが、返事にはなっているようです。文章が途中で切れてしまっているのは、Token数を制限しているからなので、モデルの性能には関係ありません。
日本語テスト
次に、日本語で「こんにちは」とプロンプトを与えてみました。
こんにちは、新田です。
以前に、新田さんが2014年8月に新田さんと2017年まで3月に「長女」を迎えました。
今回は、新田さんの3月4日の1時間27日 から、新田さんの3月6日の1時間34分の
なぜか太字を多用しているだけでなく、おかしな日本語になってしまっています。英語に対して、日本語の性能はかなり劣っているのかもしれません。
パラメータ調整
パラメータなどを調整し、何度か試してみたところ「AIとは何か、説明してください」に対して以下のような回答が得られました。
AIは人間の生命をイメージし、あなたの生活に優れた情報収集能力を提供する技術です。それは、そのデータを学習することで、データの表現や分析
またしても途中で止まってしまってはいますが、ある程度まともな回答が得られました。
とはいえ、実際に利用するにはまだまだ性能が足りていないということがわかりました。
LLMに強い会社・サービスの選定・紹介を行います 今年度LLM相談急増中!紹介実績1,000件超え! ・ご相談からご紹介まで完全無料 完全無料・最短1日でご紹介 LLMに強い会社選定を依頼する
・貴社に最適な会社に手間なく出会える
・AIのプロが貴社の代わりに数社選定
・お客様満足度96.8%超
・GPT、Claude、Gemini、Llama等の複数モデルに対応
VaultGemmaについてよくある質問まとめ
- ライセンスや商用利用は?
Gemmaのファミリーモデルであり、Gemma Terms of Useに従います。
改変や配布は認められていますが、商用利用については明確でないため、注意が必要です。
詳しくは、公式ページをご確認ください。
- 性能はどの程度ですか?
従来の非DPのモデルと比較するとかなりの性能差があり、ベンチマークでは古いモデルであるGPT-2と同程度の水準とされています。
実際に使用してみた結果でも、特に日本語出力の不自然さが顕著で実用は難しい性能であることがわかりました。
まとめ
VaultGemmaは、プライバシーを最優先とする手法であるDPによって学習が行われたLLMです。
結果として、GPT-2と同水準の実用性と、強力なプライバシー保証を同時に提供しています。
現状では、実用できる性能とは言い難いですが、今後DP訓練のさらなる最適化と研究が進むことで、プライバシーと性能のギャップは着実に縮小され、責任あるAIの発展に大きく寄与すると考えられます。
LLMに強い会社・サービスの選定・紹介を行います 今年度LLM相談急増中!紹介実績1,000件超え! ・ご相談からご紹介まで完全無料 完全無料・最短1日でご紹介 LLMに強い会社選定を依頼する
・貴社に最適な会社に手間なく出会える
・AIのプロが貴社の代わりに数社選定
・お客様満足度96.8%超
・GPT、Claude、Gemini、Llama等の複数モデルに対応

AI Market 運営、BizTech株式会社 代表取締役|2021年にサービス提供を開始したAI Marketのコンサルタントとしても、お客様に寄り添いながら、お客様の課題ヒアリングや企業のご紹介を実施しています。これまでにLLM・RAGを始め、画像認識、データ分析等、1,000件を超える様々なAI導入相談に対応。AI Marketの記事では、AIに関する情報をわかりやすくお伝えしています。
AI Market 公式𝕏:@AIMarket_jp
Youtubeチャンネル:@aimarket_channel
TikTok:@aimarket_jp
運営会社:BizTech株式会社
掲載記事に関するご意見・ご相談はこちら:ai-market-contents@biz-t.jp
