Cohere、高速・軽量な生成AIモデル「Command R7B」を発表!
最終更新日:2024年12月16日
Cohereは2024年12月14日、企業向け大規模言語モデル(LLM)「R」シリーズの最小・最速モデルとなる「Command R7B」を発表した。
このモデルは7Bパラメーターという小規模ながら、同クラスのオープンウェイトモデルの中で最高性能を実現。MacBookや低スペックGPU、CPUでも動作可能な軽量性と、128kトークンの長文コンテキスト処理能力を備え、多言語対応や検索拡張生成(RAG)、推論、ツール使用、エージェント機能など、幅広いビジネスユースケースに対応可能だ。
<本ニュースの10秒要約>
- 7Bパラメーターの小規模モデルながら、HuggingFace Open LLMリーダーボードで同クラス最高性能を達成
- 数学、コーディング、推論タスクにおいて、より大規模なモデルと同等以上の性能を少ないパラメーター数で実現
- MacBookや低スペックGPU、CPUでも動作する軽量性と、企業ユースケースに特化した機能性を両立
同クラス最高性能を実現する軽量モデル
Command R7Bは、HuggingFace Open LLMリーダーボードにおいて、同じパラメーター規模のオープンウェイトモデルの中で総合1位を獲得した。特に数学やコーディング、推論タスクにおいては、より大規模なモデルと同等以上の性能を実現している。また、多言語翻訳においても高い精度を示しており、グローバルなビジネス展開に対応可能な性能を有している。
企業向けRAGとツール使用に最適化
検索拡張生成(RAG)やツール使用、AIエージェントのユースケースにおいて、同規模のモデルを上回る性能を発揮する。特にRAGでは、インライン引用機能により幻覚を大幅に削減し、事実確認を容易にしている。また、Berkeley Function-Calling Leaderboardでも高いスコアを記録し、実世界の多様な環境でのツール使用能力の高さを示している。
効率的な運用と高速な処理を実現
コンパクトなモデルサイズにより、高スループットでリアルタイムなユースケースに対応可能だ。チャットボットやコードアシスタントなどの用途で、消費者向けGPUやCPUでの推論を実現し、デプロイメントコストを大幅に削減できる。また、企業グレードのセキュリティとプライバシー基準も維持している。
市場投入と価格設定
Command R7Bは、CohereプラットフォームおよびHuggingFaceで即日利用可能だ。入力トークンは100万トークンあたり0.0375ドル、出力トークンは100万トークンあたり0.15ドルの価格設定となっている。研究コミュニティへのアクセス提供を目的として、モデルの重みも公開される。
AI Market の見解
Command R7Bの登場は、企業向けAI市場に大きな影響を与える可能性が高い。従来、高性能なLLMの導入には高価なインフラ投資が必要だったが、本モデルは一般的なハードウェアでの運用を可能にし、中小企業でもAIシステムの実装が容易になる。特に、RAGやツール使用における高い性能は、カスタマーサービスやHR、コンプライアンス、ITサポートなどの業務効率化に直接的な効果をもたらすだろう。
また、オープンウェイトでの提供は、AI技術の民主化を促進し、イノベーションの加速につながると予想される。
参照元:cohere
AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp