最終更新日:2024-09-17
Llama2(ラマ2)とは?日本語使える?MetaのオープンソースLLMの使い方徹底解説!
Meta(旧Facebook)社が開発した「Llama2(ラマ2)」というLLMを聞いたことがあるでしょうか。AIモデルといえばOpenAI社のChatGPTが有名ですが、Llama2はGPT3.5に匹敵するモデルとして注目されています。
高性能であるにもかかわらず
そこでこの記事では、
AI Marketでは
LLMを活用した自然言語処理に強いAI開発会社を自力で選びたい方はこちらで特集していますので併せてご覧ください。
目次
Llama2とは?
Llama(Language Large Models Meta AI)とは、Meta社が2023年3月に発表したオープンソースのLLM(大規模言語モデル)です。なかでも注目を集めているのは、2023年7月にリリースされた「Llama 2」です。前バージョンの約1.4倍のデータで訓練されているため、ChatGPTに使われているGPT-3.5に匹敵する性能を発揮できるといわれています。
パラメータ数が少なくコンピュータへの負荷が少ないものの、ほかのLLMよりも性能が高く、商用利用も無料でできるようになっています。
LLMとは?代表的なLLMの事例をこちらの記事で詳しく説明していますので併せてご覧ください。
Llamaの将来性は?
Meta社はすでにAIスタートアップ企業と提携しており、Llama 2に対応するサービスも開発中です。Microsoft社やAmazon社もLlama 2へのアクセス提供を開始しており、今後GPTに並ぶLLMとなるでしょう。
Meta社は、メタバース(仮想空間)を実現するための技術やプラットフォームを開発しています。メタバースでは、人々がVRやARなどの技術を使って、スクリーンの先にある新しい世界を体験できるようになります。Llamaは、メタバースで人々が自然にコミュニケーションがとれるようになるための技術として、重要な役割を果たすでしょう。
Llamaを活用すれば、人々の言語や文化を理解し、適切な応答や生成を行うことができます。Llamaは、メタバースでの会話やコラボレーション、エンターテイメントなどの体験を豊かにすることができます。
2024年4月にLlama 3を発表
ここまで、Llama 2を中心に解説を行いましたが、2024年4月19日(日本時間)に、Meta社はLlama 3を発表しました。8Bパラメータモデル、70Bパラメータモデルの2つを提供し、多言語・マルチモーダルに対応したモデルも提供する予定です。
Llama 2と比較し、トークン生成数が最大15%減少しており、AWSやGCP、Microsoft Azureなどで近日提供開始予定とのことです。
Llama 3とは?さらに何がすごくなったか?こちらの記事で詳しく説明していますので併せてご覧ください。
Llamaの特徴
Llamaには主に以下の特徴があります。ここでは、これらの特徴について詳しく見ていきましょう。
- 小型かつ高性能なAIモデル
- 無料で使えて商用利用も可能
- オープンソースで公開
- プログラミング支援機能「Code Llama」を備える
小型かつ高性能なAIモデル
Llamaは、小型かつ高性能なAIモデルとして注目されています。Llamaは、パラメータ数が10分の1程度という小型のLLM(SLM)にもかかわらず、先行のGPT-3などのモデルと比較して高性能なAIモデルです。
パラメータ数とは、AIモデルの学習能力や複雑さを表す指標で、パラメータ数が多いほど、モデルが扱える情報量や表現力が高くなります。しかし、パラメータ数が多いと、モデルのサイズや計算量も増えるため、コンピュータの性能やコストに影響します。
Llamaは、パラメータ数によって以下4つのバージョンが用意されています。
- 70億パラメータ
- 130億パラメータ
- 330億パラメータ
- 650億パラメータ
これらのパラメータ数は、GPT-3のパラメータ数である1750億パラメータよりもはるかに少ないです。しかし、その性能は70億パラメータのバージョンでもGPT-3と並び、130億パラメータ以上であればGPT-3を超える性能であるという調査結果も出ています。
このように、少ないパラメータを効率的に活用することで、コンピュータへの負荷を抑えつつ高い性能を発揮できるSLMであることがLlamaの特徴の一つです。
無料で使えて商用利用も可能
Llamaは高性能なLLMであるにもかかわらず、無料で利用可能です。さらに商用利用も無料でできるため、さまざまな個人や企業による活用が期待されます。現在、生成AIの市場はChatGPTを代表とするOpenAI社がリードしていますが、LlamaもGPTと並ぶLLMとして認知されるでしょう。
Llamaを商用利用する場合は、ライセンスをよく読んでおく必要があります。とくに気をつける点は、以下です。
- Llama 2を使ったプログラムを第三者に提供する場合は、このライセンス資料も提供する必要がある
- 月間のアクティブユーザーが7億人以上になる場合、Meta社にライセンスを申請する必要がある
- Llamaの使用で生じた損失利益や間接的な損害についてMeta社は責任を負わない
- 契約違反やLlamaに関する訴訟を起こした場合、ライセンスは終了する
これらの点に注意してLlamaの商用利用を行ないましょう。
参考:Llama Community License Agreement
オープンソースで公開
Llamaは無償で利用できるだけでなく、GitHubでオープンソースで公開されているのも大きな特徴です。LLMの開発には高度な技術力や大量の計算資源が必要ですが、オープンソース化によって、既存のモデルやコードを再利用したり、他の開発者と協力したりできるため、開発の効率化やコスト削減ができます。
また、ソースコードを自由に改変したり、自社のニーズに合わせてカスタマイズしたりできるため、利用の柔軟性や拡張性が高まります。そして、LLMの性能や品質を客観的に評価できる情報が豊富になり、利用するLLMの選択や比較が容易になります。
Llamaを利用する開発者が増えてコミュニティが活発になるのもオープンソースのメリットです。広く利用されることで多くの技術者がLlamaに関する知見を持ち、情報収集がしやすくなります。
Llama以外にも、フランス発のスタートアップMistral、SolarなどオープンソースのLLMが続々公開されています。これからはオープンソース化による集合知の活用によって、技術の革新や拡張を目指す方向性がメインになるかもしれません。
プログラミング支援機能「Code Llama」を備える
Llamaには、プログラミング支援機能である「Code Llama」も備わっています。Code Llamaでできることは、主に以下の3つです。
- プログラムを補完する
- 命令からプログラムを作成する
- プログラミングに関する質問に回答する
また、モデルが3種類あり、それぞれ得意なジャンルが異なります。モデル名と主な機能の一覧は以下のとおりです。
モデル名 | パラメータ数 | 主な機能 |
---|---|---|
Code Llama | 70億・130億・340億 |
|
Code Llama – Python | 70億・130億・340億 |
|
Code Llama – Instruct | 70億・130億・340億 |
|
各モデルは精度も高いため、プログラミング目的で利用する場合には活用してみてはいかがでしょうか。LLMベースでもライバルと言えるGPTが搭載されているGitHub Copilotの強い競合となることが予想されます。
関連記事:「コード生成AIとは?企業ユースにおすすめのサービスでプログラミングを効率化!」
AI Marketでは
Llama 2は日本語で使える?
Llama 2は日本語で利用できるのか疑問に感じている方もいるのではないでしょうか。ここでは、Llama 2の日本語対応について解説します。
日本語対応しているものの精度は低い
Llama 2は日本語に対応していますが、その精度は低いです。Llamaは、英語だけでなく、日本語や中国語などの他の言語にも対応しています。Llamaは、多言語のテキストコーパスを用いて事前学習されており、異なる言語間の知識や文化を共有できるように設計されています。
しかし、現状では日本語での学習量は少ないようです。特に、日本語の入力はある程度理解していますが、日本語での出力が苦手です。Llamaを利用する際は英語出力を行なったうえで、ChatGPTなども併用して翻訳を行なうとよいでしょう。
また、パラメータ数によっても精度が異なります。どうしてもLlama単体で日本語出力をさせたい場合は、パラメータ数が多いモデルの利用がおすすめです。まだ日本語利用は十分できるとはいえないため、今後の日本語への対応強化が期待されます。
Llamaベースの日本語モデルも公開
Llamaをベースにした日本語モデルのLLMもサードパーティによって開発されています。たとえば、AIキャラクタービジネスを手がけるrinna株式会社は、2023年10月にLlama 2をベースに日本語学習を行なった「Youri 7B」シリーズを発表しました。
Youri 7Bシリーズは、Llamaの70億パラメータモデルへさらに日本語・英語を400億トークンさらに学習させたモデルです。Youri 7Bは日本語の学習量が少ないLlamaの弱点を補ったモデルでベンチマークスコアも高水準ですが、ファイルサイズが大きいため動かすコンピュータのスペックが要求される側面もあります。
他にも、ELYZA-japanese-Llama-2も公開されています。これは、ELYZAという日本語の自然言語処理のためのライブラリを用いて、Llama 2を日本語にファインチューニングしたLLMです。このモデルは、文章生成や質問応答などのタスクに対応し、商用利用も可能です。
Llamaベースの日本語モデルは多く開発されているため、用途に応じてさまざまなモデルを利用してみてください。
関連記事:「日本語特化LLMおすすめ徹底解説!なぜChatGPTだけでは不十分?現状と今後の期待」
Llama 2を利用できるサイト
それでは、Llama 2はどこで利用できるのでしょうか。データファイルをダウンロードしてローカルコンピュータ上で環境構築する方法もあります。しかし、設定や利用方法が複雑なため、ここではブラウザ上で動作するLlama 2が利用できるサイトを以下の3つ紹介します。
- llama 2.ai
- Perplexity Labs
- Replicate.com
llama2.ai
llama2.aiでは、サイトにアクセスするだけでブラウザ上でLlama 2が動作するチャットボットを利用できます。日本語には対応していませんが、「Settings」からLlamaの設定ができ、モデルやシステムプロンプトなどを変更可能です。
必要最小限の機能だけを備えたシンプルなWebアプリですが、まずはLlamaの性能や使い心地を知りたいという方には十分有用でしょう。
Perplexity Labs
Perplexity Labsは、オープンソースのAIモデルが複数搭載されており、それぞれを試すことができるチャットボットです。右下のメニューから利用したいモデルを選び、テキストボックスにプロンプトを入力します。
選択できるモデルはLlamaでは70億パラメータモデルのみですが、プログラミングに特化した「Code Llama」や、Llamaに画像エンコーダーを合わせた「LLaVA」など、さまざまなバリエーションを試すことが可能です。
関連記事:「Perplexity AIとは?AI×検索エンジンサービスの機能や使い方・活用方法を徹底解説!」
Replicate.com
Replicate.comは、さまざまなAIモデルを手軽に利用できるWebサービスです。Llamaを含む無料のAIが複数搭載されており、自分でモデルをインストールすることもできます。
多くのAIモデルを試すことができる便利なサービスですが、一定時間以上の利用には料金の支払いが必要です。料金はAIを動かすコンピュータのスペックによって異なるため、利用を考えている方は料金表を参照してください。
llama2.aiでのLlamaの使い方
それでは、実際にLlamaを使うにはどのような手順を踏めばよいのでしょうか。ここではllama2.aiを利用したLlamaの使い方について、以下3ステップに沿って解説します。
- llama2.aiへアクセスする
- AIモデル選択など設定を行なう
- プロンプトを入力する
llama2.aiへアクセスする
まず、llama2.aiのサイトへアクセスしましょう。llama2.aiではアカウント登録などは必要なく、誰でもすぐにLlama 2の利用が可能です。
AIモデル選択など設定を行なう
次に、設定を行ないましょう。設定項目は以下のとおりです。
- Llama Size(Llamaのモデル)
- System Prompt(システムプロンプト)
- Temperature(確率分布の散らばり具合)
- Max Tokens(最大トークン数)
- Top P(上位X%のトークンを取得)
とくに利用しやすいのは、Llama SizeとSystem Promptです。Llama SizeではLlama 2の各パラメータ数モデルや、画像エンコーダーを合わせた「LLaVA」などからモデルを選択できます。
System Promptは、プロンプトを入力する際に常にその前段として付け加えられるプロンプトで、応答の指針となります。System Promptを設定しておくことで、答えてほしい文体やターゲット層などをあらかじめ指定しておくことが可能です。
プロンプトを入力する
設定が完了したら、実際にプロンプトを入力しましょう。画面下部のテキストボックスに質問を入力してエンターキーまたは「Chat」ボタンをクリックしましょう。
質問内容や返答がチャット形式で表示されます。
日本語での入出力も対応していますが、日本語が不自然だったり、英語で返されてしまったりする場合も多いです。また、「Upload」ボタンからは画像ファイルなどをアップロードでき、質問の一部として組み込むことができます。
プロンプトとはなにか?をこちらの記事で詳しく説明していますので併せてご覧ください。
Llama2(ラマ2)についてよくある質問まとめ
- Llama2の主な特徴は何ですか?
Llama2の主な特徴は以下の通りです。
- 小型かつ高性能なAIモデル(GPT-3.5に匹敵する性能)
- 無料で使用でき、商用利用も可能
- オープンソースで公開されている
- プログラミング支援機能「Code Llama」を備えている
- パラメータ数によって4つのバージョン(7B、13B、33B、65B)がある
- Llama2は日本語で使えますか?その精度はどうですか?
- 日本語に対応しているが、精度は低い
- 日本語入力はある程度理解できるが、日本語出力が苦手
- パラメータ数が多いモデルの方が日本語精度は高い
- Llama2をベースにした日本語モデル(Youri 7B、ELYZA-japanese-Llama-2など)が開発されている
- Llama2を簡単に試すにはどうすればいいですか?
Llama2を簡単に試す方法は以下の通りです。
- llama2.ai、Perplexity Labs、Replicate.comなどのWebサイトを利用する
- llama2.aiの場合、以下の手順で利用可能:
- サイトにアクセスする(アカウント登録不要)
- 設定(Llama Size、System Promptなど)を行う
- プロンプトを入力して結果を得る
- 日本語での入出力も可能だが、精度に注意が必要
まとめ
この記事では、Meta社のオープンソースLLMであるLlamaについて解説しました。Llamaは、日本語への対応はまだ十分とはいえませんが、低パラメータで高性能を引き出す効率的なLLMです。
オープンソースで商用利用も無料であることから、今後も利用の幅が広がっていくでしょう。Webサービスを利用することで無料で簡単に試すことも可能であるため、まずはllama2.aiなどにアクセスして触ってみてはいかがでしょうか。
AI Marketでは
AI Market 運営、BizTech株式会社の代表取締役です。2021年にサービス提供を開始したAI Marketのコンサルタントとしても、お客様に寄り添いながら、お客様の課題ヒアリングや企業のご紹介を実施しています。AI Marketの記事では、AIに関する情報をわかりやすくお伝えしています!