最終更新日:2024-09-06
Google PaLM 2とは?概要から何ができるかまで徹底解説!
Google PaLM 2とはGoogleが開発したLLM(大規模言語モデル)です。もともとはGoogle PaLMとして2022年4月にGoogleが発表した言語モデルから2023年5月にアップデートしたものとなります。
ChatGPT以降、生成AIへの注目が大きく高まり、巨大テック企業をはじめとしてさまざまな企業が生成AIのサービスをリリースしています。しかし、その中心となる
LLMとは何?どんな仕組み?どう使う?こちらの記事で詳しく説明していますので併せてご覧ください。
この記事では
AI Marketでは
LLMの導入に強いAI開発会社を自力で選びたい方はこちらで特集していますので併せてご覧ください。
目次
Google PaLM 2とは?
Google PaLM 2とはGoogleが開発したLLM(大規模言語モデル)です。大規模言語モデルとは、大量のデータをトレーニングしてできる統計言語モデルになります。大規模言語モデルは主にテキストの生成や言語の翻訳など、自然言語処理タスクに利用されます。
大規模言語モデルの代表例は、PaLM以外にもChatGPTを開発しているOpen AIのGPTやAnthropicのClaude、MetaのLlamaなどが挙げられます。
Google PaLM 2のPaLMはPathways Language Modeの略です。Googleが開発している汎用AIプロジェクト「Pathways」の一環でPathwaysは、様々なタスクを効率的かつ迅速に学習・処理できることを目指しています。
PaLMベースにしたMinervaというモデルでは、さまざまなタスクを学習して処理できます。技術の応用例としては、航空写真から標高を予測するモデルを、洪水で起きる水の流れ方の予測に適応した例が発表されています。また、動物を認識するためにテキストだけでなく音声や画像でも反応できるように訓練されており、汎用AIとしての潜在能力に注目が集まっています。
汎用AIは強いAIとも呼ばれ、AIが人間のようにふるまうシンギュラリティのきっかけとなることが期待されています。
Google PaLMから向上したこと
Google PaLMからアップデートされたGoogle PaLM 2では、多言語テキストの対応や推論の強化、さらなる高速化と効率化などが発表されました。Google PaLM 2では100以上の多言語テキストを用いて、言語独自のニュアンスや詩なども学習され、言語理解・テキスト生成、翻訳の能力が大きく向上しました。
Google PaLM 2では文脈理解の理解度が向上したため会話の微妙なニュアンスまで理解できるようになっています。
推論では学習したデータセットに数式を含む科学論文も含まれており、ロジックや通常の推論の能力も強化されています。Google PaLM 2を搭載した製品が25以上発表され、医療やサイバーセキュリティの分野など幅広く利用されたりしています。
Google PaLM 2でできることは?
Google PaLM 2ができることは、数学的な推論や翻訳、プログラミング能力などが挙げられます。Google PaLM 2はどのようなことができるか理解しておくことで、AI導入に必要な知識を深めたり、導入する参考にできるので確認していきましょう。
数学的な推論
Google PaLM 2は数学的な推論が得意です。数学的な推論能力とは複数の数学的な命題を正しく理解し、適切な解答を導く能力です。
Google PaLMから推論機能が優秀で注目されてきましたが、Google PaLM 2が利用した学習データに数式を含む科学論文などが含まれ、数学的な推論も強化されました。
実際にGoogleは、複数の推論テストでGoogle PaLM 2は他の生成AIやGoogle PaLMよりも高いスコアを出したことを発表しています。
文章の自然な翻訳
Google PaLM 2は文章の自然な翻訳も可能です。100以上の多言語テキストを学習し、学習データの中には慣用句や詩、なぞなぞに至るまで幅広いパターンが含まれています。
そのため、Google PaLM 2は言語特有のニュアンスや表現を正しく理解し、適切にアウトプットすることができます。多言語に対応しているため翻訳能力にも優れており、自然な翻訳も可能です。Googleは、上級レベルの言語試験で「習得」レベルに到達したことを発表しており、優れた言語理解能力があることを示しました。
プログラミング
Google PaLM 2は、主にGitHubで公開されている大量のソースコードを学習済みのため、プログラミング能力に優れています。学習したプログラミング言語はPythonやJavaScriptからPrologやFortranまで多様な種類の言語が含まれています。
能力としては人間がテキストで指示した内容を理解し、適切なコード生成を行ったり、バグ修正やすでにある言語を他の言語へ変換する処理などが可能です。
ジョークを理解し説明ができるほどの言語理解
Google PaLM 2は言語理解に長けており、推論能力により文章を論理的に理解することができるため、ジョークを理解して説明することも可能です。
論文では、ネットに公開されていない英語のジョークを入力すると、そのジョークの意味を説明し、なぜジョークが面白いのか説明している事例が紹介されました。幅広い言語理解や人間と自然な対話の実現可能性も示唆されており、将来的により複雑な質問に高速で回答するようになると注目されています。
AI Marketでは
Google PaLM 2の使い方
Google PaLM 2はPaLM APIとしてAPI経由で利用可能です。Google PaLM 2を利用するにはまず、Google Cloudアカウントを設定する必要があります。無料トライアルを含むアカウントを作成でき、このトライアルには$300のクレジットが付いており90日間有効です。
Google Cloudアカウントを設定したら、Vertex AI APIを有効にする必要があります。Vertex AIは、Googleが提供する機械学習のフルマネージド型プラットフォームです。GoogleのサービスであるAI Platform と AutoMLが一つのインターフェースに統合されており、機械学習を中心とした多くのAIサービスが利用できます。
Cloud Console内のVertex AIページに移動し、APIとサービスを有効にし、Vertex AIを選択し、API資格情報の作成手順に従います。
関連記事:「AI導入用APIをプラットフォーム別に紹介!各ツールの特徴を徹底解説!」
これらの手順を完了すると、PaLM 2モデルとの対話を開始できます。Vertex AIコンソールでは、PaLM 2を使用してチャットプロンプトを作成するオプションがあります。
将来的にはGmailやGoogleドキュメントをはじめとするGoogle Workspaceの機能にもGoogle PaLM 2が搭載されるため、Googleサービスを利用するだけでGoogle PaLM 2が使えるようになるでしょう。
Googleが後続モデルGeminiを発表
Googleは2023年12月に生成AIモデルのGeminiを発表しました。GeminiはGoogle PaLM 2の後続モデルにあたるとみられており、マルチモーダルとして1から構築されています。
マルチモーダルとはテキスト・画像・動画などさまざまなデータ種別を意味します。Geminiはたくさんの種類のデータをシームレスに理解し、非常に柔軟なモデルとして注目されています。
ここではGeminiがGoogle PaLM 2から向上したこと、具体的に何ができるのか、利用するにはどうすれば良いかを解説していきます。
Geminiとは何か、何がすごいのか、こちらの記事で詳しく説明していますので併せてご覧ください。
PaLM 2から向上したこと
GeminiはGoogle PaLM 2にくらべて処理速度が向上しています。GeminiではCloud TPU v5pというAI学習に特化した半導体を利用しており、Google PaLM 2で利用していたTPU v4に比べて2.8倍の処理速度を実現しました。
TPU(Tensor Processing Unit)とはGoogleが独自に開発している半導体で、AIの根幹を担うディープラーニングの処理速度を高速化するために開発されています。2018年からGoogle Cloudユーザーがクラウド上でTPUを活用できる「Cloud TPU」を展開しており、Pythonや機械学習ライブラリのTensorFlowを通じて利用できます。
Geminiはマルチモーダルネイティブのため、テキスト入力以外のインプットから適切なアウトプットの出力を可能にしています。Google PaLM 2以上に幅広く正確な言語理解が可能になっています。
Google Geminiができること
Geminiができることとして、高度な推論、画像や音声の理解、高度なコーディング力などが挙げられます。Google PaLM 2よりも高い処理性能を持っているため、推論能力に優れています。
Geminiはマルチモーダルネイティブのため、画像や音声の内容を理解し、画像内の文字を認識して回答に反映することができます。Googleは、アヒルの絵と関係ない絵の2つが写されている動画の入力データから、正しくアヒルの絵を判断し回答に答えているビデオが公表されています。
Geminiは高度なコーディングも可能で、品質の高いコード生成を提供しています。GoogleはGeminiを利用したコード生成システムAlphaCode 2を開発し、競技プログラミングのコンテストで参加者の85%よりも高パフォーマンスを発揮したことを発表しました。
Google Geminiの利用方法
GeminiはGoogle BardやAPI、スマートホンPixel 8 Proから利用できます。Google Bardから利用する場合、現在は英語版のChromeのみ利用可能で、モデルはGemini Proが使用できます。
APIから利用する場合、Google AI StudioかVartex AIからGemini ProとGemini Pro visionの2つのモデルにアクセス可能です。Pixel 8 ProにはGemini nanoが標準搭載されているため、インストールなども不要で、製品を購入すればすぐに利用することができます。
Google PaLM 2についてよくある質問まとめ
- Google PaLM 2とは?
Google PaLM 2とはGoogleが開発したLLM(大規模言語モデル)です。Google PaLM 2のPaLMはPathways Language Modeの略です。Googleが開発している汎用AIプロジェクト「Pathways」の一環でPathwaysは、様々なタスクを効率的かつ迅速に学習・処理できることを目指しています。
- Google PaLM 2とGeminiの違いは?
Googleは2023年12月に生成AIモデルのGeminiを発表しました。GeminiはGoogle PaLM 2の後続モデルにあたるとみられており、マルチモーダルとして1から構築されています。Geminiはたくさんの種類のデータをシームレスに理解し、非常に柔軟なモデルとして注目されています。GeminiではCloud TPU v5pというAI学習に特化した半導体を利用しており、Google PaLM 2で利用していたTPU v4に比べて2.8倍の処理速度を実現しました。
まとめ
今回はGoogle PaLM 2に関して、概要や旧モデルから向上したこと、何ができるのか、更なる後続モデルのGeminiの概要など徹底解説しました。Google PaLM 2は言語理解に優れており、人間同士の微妙なニュアンスも理解して正確な回答を導くことが可能です。
後続モデルの
ぜひこの記事を参考に、AI導入のきっかけにしていきましょう。
AI Marketでは
AI Market 運営、BizTech株式会社の代表取締役です。2021年にサービス提供を開始したAI Marketのコンサルタントとしても、お客様に寄り添いながら、お客様の課題ヒアリングや企業のご紹介を実施しています。AI Marketの記事では、AIに関する情報をわかりやすくお伝えしています!