Cohereが最上位リランカー「Rerank 4」を発表、32Kコンテキストウィンドウと自己学習機能を搭載
最終更新日:2025年12月18日

Cohereは2025年12月12日、企業向けAI検索のための最上位リランカーモデル「Rerank 4」を発表した。32Kコンテキストウィンドウの搭載により従来モデルの4倍の処理能力を実現し、MongoDBのVoyageモデルやElasticSearchのJinaリランカーを上回る検索精度を達成している。
- 従来比4倍の32Kコンテキストウィンドウにより長文書の複数段落を同時評価可能
- 速度重視のFastと精度重視のProの2バージョンで多様な業務要件に対応
- アノテーションデータ不要の自己学習機能により特定ドメインで精度が反復的に向上
Rerank 4は、BM25やバイエンコーダー埋め込みによる初期検索結果を精緻化するクロスエンコーダーアーキテクチャを採用している。クエリと候補文書を同時処理することで、ユーザーの意図に関する微妙な意味的関係を捉え、最も関連性の高い項目を表示する。

32Kコンテキストウィンドウの搭載により、長文書の処理や複数段落の同時評価が可能となり、短いウィンドウでは見逃されるセクション間の関係も捕捉できる。公開ベンチマークBEIRおよび内部評価において、Rerank 4は金融、医療、製造などの企業ドメインで競合モデルを上回る性能を示した。
Rerank 4は処理速度を優先する「Fast」と深い分析と精度を重視する「Pro」の2バージョンで提供される。Fastはeコマースでの商品推薦、プログラミング時の設計仕様参照、カスタマーサービスでのチケット対応など、迅速な応答が求められる用途に適している。
一方、Proは金融のリスクモデル生成、医療での診療記録レビュー、製造業の品質管理における技術マニュアル参照など、情報の正確性と完全性が重要な業務に最適化されている。

多言語対応では100以上の言語で利用可能であり、アラビア語、中国語、フランス語、ドイツ語、ヒンディー語、日本語、韓国語、ポルトガル語、ロシア語、スペイン語の10主要ビジネス言語で最先端の検索性能を実現している。

Rerank 4の特徴的機能として自己学習機能が挙げられる。これはリランカーモデルとして初めて搭載された機能であり、追加のアノテーションデータなしで特定のユースケースに合わせたカスタマイズが可能だ。
特定のコンテンツタイプへの優先順位付け、規定された用語の使用、特定文書コーパスへの誘導などが実現できる。例えば商業銀行の消費者ローン担当者が、承認基準や商品詳細、規制基準に関する内部文書を頻繁に参照する場合、自己学習によりRerank 4 Fastの精度が反復的に改善され、大規模な競合モデルに匹敵する性能を達成する。
公開ベンチマークViDoRe V3での評価では、自己学習を有効化したRerank 4 Fastが、報告書、請求書、フォーム、技術文書などの視覚的に豊富な企業文書において、標準のPro性能に収束または上回る結果を示した。

Rerank 4はCohereのエージェント型AIプラットフォーム「North」の主要コンポーネントとして機能し、検索機能、大規模言語モデル、カスタマイズ可能なAIエージェントを統合している。
RAGパイプラインの改善に加え、エージェント型AIシステムにおいて高品質な情報を提供することで、推論の強化とコンテキスト認識型エージェントの性能向上に貢献する。
生成モデルに到達する前に無関係なコンテンツをフィルタリングすることで、トークン使用量を削減し、エージェントが「正しい結果を得る」ために必要な再試行回数を最小限に抑える。
Rerank 4は現在、CohereプラットフォームおよびAmazon SageMaker AI、Microsoft Foundryで利用可能であり、Virtual Private Cloudやオンプレミス環境への展開も可能だ。
AI Market の見解
Rerank 4の技術的革新は、企業向けAI検索の実用性を大きく前進させるものと想定される。32Kコンテキストウィンドウの拡張は、単なる処理能力の向上にとどまらず、長文書内の文脈依存的な関係性を正確に把握することを可能にする。
これにより契約書や研究論文、技術仕様書など、複雑な企業文書の検索精度が実質的に向上する。FastとProの2層構造は、レイテンシとコストの最適化を求める企業に対し、ワークロードに応じた柔軟な選択肢を提供している。
特にeコマースやカスタマーサポートなどリアルタイム性が重視される分野では、Fastの高速処理が顧客体験の向上に直結すると想定される。一方、医療や金融など規制要件が厳格な業界では、Proの高精度が誤情報によるリスクを最小化する。
自己学習機能の実装は、リランカーモデルの展開において従来のボトルネックであったドメイン適応の労力を大幅に削減する。アノテーションデータの準備が不要になることで、企業は迅速にモデルを自社の業務要件に適合させることが可能になる。
参照元:Cohere
Rerank 4に関するよくある質問まとめ
- Rerank 4のFastとProはどのように使い分けるべきか?
Fastは速度と精度の両立が求められるeコマース、プログラミング支援、カスタマーサービスなどで推奨される。一方Proは、金融のリスク分析、医療の診療記録レビュー、製造業の品質管理など、情報の正確性が最優先される業務に適している。自己学習機能を活用すれば、Fastでも特定ドメインにおいてPro相当の精度を達成できるため、コスト効率を考慮した選択が可能だ。
- 自己学習機能はどのように機能するのか?
自己学習機能は、追加のアノテーションデータを必要とせず、特定のユースケースに合わせてモデルをカスタマイズする。特定のコンテンツタイプへの優先順位付け、規定用語の使用、特定文書コーパスへの誘導などを設定することで、モデルが反復的に精度を向上させる。これにより企業固有の検索要件に迅速に適応し、ドメイン特化型の高精度検索を実現する。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
