シナモン、非構造ドキュメントからの情報抽出が可能な新ドキュメントLLM「Super RAG」発表
最終更新日:2024年03月28日
株式会社シナモンは、2024年3月26日、新たなドキュメントLLM(大規模言語モデル)「Super RAG」を発表した。
同社は、国内の大手企業に向けてAIソリューションを提供している企業だ。「Super RAG」は、生成AIを活用することで表/図/グラフ/手書きといった非構造ドキュメントからの情報抽出を可能にしたLLMであり、ドキュメントをそのまま取り込むことで企業の業務効率改善やナレッジ活用を大幅に推進するものとなっている。
<本ニュースの10秒要約>
- 手書きといった非構造ドキュメントからの情報抽出を可能にしたLLM「Super RAG」
- 「取得拡張生成」とも訳されるRAGへのニーズが高まっていることに着目して開発
- ドキュメント解析/意味抽出の技術を活用し、RAGの課題を克服。企業のLLM活用を促進
企業におけるLLM導入を促進するシナモン
シナモンは、「誰もが新しい未来を描こうと思える、創造あふれる世界を、AIと共に」というパーパスを掲げて、AIプロダクトとAIコンサルティングの提供を手がけている。AI-OCR「Flax Scanner」や自然言語処理エンジン「Aurora Clipper」、また音声認識エンジン「Rossa Voice」などを開発/提供し、国内大手企業への提供実績も多い。
AI事業を展開する中で同社は、企業におけるLLM導入を促進する方法としてRAG(Retrieval Augmented Generation)へのニーズが高まっていることに着目した。RAGは、LLMのテキスト生成に外部情報の検索を組み合わせて回答精度を向上させる技術であり、「検索拡張生成」「取得拡張生成」とも訳される。最新性/正確性の担保やハルシネーションの抑制効果といった面でRAGは多くの期待を集めているが、一方でデータを取り込むプロセスにおける多くの課題も抱えている。
RAGのさらなる活用を推進する必要があると考えたシナモンは、新たなドキュメントLLMの開発を決定。非構造化データを幅広くカバーする同社の技術力を活用し、「Super RAG」を完成した。
RAGが抱える「文書の複雑性」などの課題を克服する「Super RAG」
「Super RAG」は、RAGが抱える「文書の複雑性」「ドメイン知識の不足」「あいまいなプロンプトによる精度低下」という課題を克服するLLMだ。開発に際しては、AI-OCR/自然言語処理/音声認識といった非構造化データについて同社が蓄積してきたドキュメント解析/意味抽出の技術を活用。また、ドメインナレッジの活用やプロンプト自動生成といった独自技術も組み込み、あらゆる文書からの情報の取り込みを実現した。
一般的なRAGシステムではこれまで、図表からの読み取りは難易度が高いとされてきた。しかし「Super RAG」では、「注釈や補足が多い複雑な表からの情報抽出」「チャート図からのカテゴリー構造の言語化」「複雑なダイアグラムからの作業手順の抽出」なども可能となっている。
パートナーシップの提携なども既に推進
シナモンは今後「Super RAG」を、LLMの自社活用を検討している企業などに向けて販売する。また、エンドユーザーのLLM利用を支援するパートナー企業に向けても販売を推進し、アプリケーションに「Super RAG」を組み込んで共同提供を行うパートナーシップの提携なども既に進めている。
同社は今後も「Super RAG」を積極的に展開し、企業のLLM活用を大幅に促進するとしている。
参照元:PRTIMES
LLMについて詳しく知りたい方はこちらの記事もご参考ください。
AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp