Meta、画像認識と軽量モデルを搭載したLlama 3.2を発表
最終更新日:2024年11月28日

2024年9月25日(現地時間)、Metaは最新のAIモデル「Llama 3.2」を発表した。この新モデルは、画像認識機能を持つ中型のLLM(11Bと90B)と、エッジデバイスや携帯端末で動作する軽量テキストモデル(1Bと3B)を含む。
Llama 3.2は、オープンソースかつカスタマイズ可能なモデルとして、エッジAIと画像認識技術の革新を目指している。Metaは、AIの民主化と革新を促進するため、これらのモデルを無償で公開すると共に、開発者向けのツールやリソースも提供する。
<本ニュースの10秒要約>
- 画像認識機能搭載の中型モデルと軽量テキストモデルを含む新AIモデル「Llama 3.2」を発表
- エッジデバイスや携帯端末での利用を可能にする1Bと3Bの軽量モデルの導入
- オープンソースで公開され、カスタマイズ可能なモデルによるAI開発の民主化の促進
Llama 3.2の新機能と性能
Llama 3.2は、画像認識機能を持つ11Bと90BのLLM(大規模言語モデル)、そしてエッジデバイスや携帯端末向けの1Bと3Bの軽量テキストモデルを含む。11Bと90Bモデルは、文書レベルの理解、画像のキャプション生成、視覚的なグラウンディングタスクなどの画像推論ユースケースをサポートする。
これにより、グラフや地図などの視覚情報を含む複雑な質問に答えることが可能となる。一方、1Bと3Bモデルは、多言語テキスト生成とツール呼び出し機能を備え、プライバシーを重視したオンデバイスのパーソナライズされたアプリケーション開発を可能にする。
評価では、Llama 3.2のビジョンモデルがClaude 3 HaikuやGPT-4o miniなどの主要な基盤モデルと競争力があることが示されている。
また、軽量モデルも十分な性能を持つことも示されている。
モデルアーキテクチャと開発プロセス
Llama 3.2の画像認識モデルは、事前学習済みの言語モデルに画像エンコーダーを統合するための新しいアダプター重みを導入している。このアプローチにより、テキストのみの機能を維持しつつ、画像入力をサポートすることが可能となった。
開発プロセスには、大規模なノイズのある(画像、テキスト)ペアデータでの事前学習、高品質なドメイン内データでの訓練、そしてアライメントのための複数ラウンドの監督付き微調整が含まれる。
軽量モデルの開発では、プルーニングと蒸留の手法を用いて、より大きなモデルの知識と性能を可能な限り維持しつつ、モデルサイズを縮小している。
Llama Stackの導入とエコシステムの拡大
Metaは、Llama Stackという新しい開発フレームワークを導入し、開発者がLlamaモデルを様々な環境で一貫して使用できるようにしている。これには、推論、ツール使用、RAG(検索拡張生成:Retrieval-Augmented Generation)のためのAPIリファレンス実装が含まれる。
さらに、AWS、Databricks、Dell、Fireworks、Infosys、Together AIなどのパートナー企業と協力し、エンタープライズクライアント向けのLlama Stack配布版を構築している。オンデバイス配布はPyTorch ExecuTorchを介して、シングルノード配布はOllamaを介して行われる。これにより、開発者はLlamaモデルを使用してより簡単にアプリケーションを構築し、デプロイできるようになる。
AI Market の見解
Llama 3.2の発表は、AIの民主化と技術革新の加速に向けた重要な一歩だ。画像認識機能を持つ中型モデルと、エッジデバイスで動作する軽量モデルの組み合わせは、AIアプリケーションの可能性を大きく広げる。また、直近でガートナーが発表したハイプ・サイクルで示されていた通り、マルチモーダル化やオープンソース化が進んでいることを裏付ける。
特に、1Bと3Bの軽量モデルは、プライバシーを重視したオンデバイスAIの実現を可能にし、個人情報保護の観点からも重要な進展だ。インターネットを介して情報をやり取りしにくい高セキュリティが求められる金融機関などの利用においては、エッジデバイスで利用可能なLLMは一つの選択肢となる。
また、これまでのLlama同様、オープンソースでカスタマイズ可能なモデルの提供は、AIの研究開発を加速させ、より多様で革新的なアプリケーションの創出につながる可能性がある。加えて、Llama Stackの導入により、開発者の生産性向上とAIアプリケーションの迅速な展開が期待される。総じて、Llama 3.2の発表は、AIの可能性を広げつつ、責任ある開発と利用を促進する取り組みとして評価できる。
参照元:Meta
LLMについて詳しく知りたい方はこちらの記事もご参考ください。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
