
LLMをLLMで評価するLLM-as-a-Judgeとは?メリット・活用シーン・注意点を徹底紹介!
近年、ChatGPTに搭載される「GPT」やAnthropicの提供するClaudeなどのLLM(大規模言語モデル)の活用が進む中で、ハルシネーションなどの問題...
生成AI、画像認識、AI開発企業等のAI会社マッチング支援サービス

近年、ChatGPTに搭載される「GPT」やAnthropicの提供するClaudeなどのLLM(大規模言語モデル)の活用が進む中で、ハルシネーションなどの問題...

LLMをビジネスで活用する際、自動評価では測れない「品質」を担保するために人による評価が不可欠 評価の目的を明確にし、正確性や一貫性といった評価項目、5段階など...

LLMの性能評価には、単語の一致率を測る伝統的な指標(BLEU, ROUGE)から文脈や意味の近さを捉える指標(BERTScore, LLM-as-a-Judg...

VaultGemmaは2025年9月12日に公開された差分プライバシー(DP)でゼロから学習したLLMでプライベートAI開発の基盤となる プライバシーを優先した...

VLM(Vision Language Model)は、画像認識AIやLLM(大規模言語モデル)が組み合わさった技術として、ビジネスにおいて幅広い応用が期待され...

企業のAI活用が加速するなか、LLM(大規模言語モデル)が業務効率化の重要ツールとして注目を集めています。しかし、LLM、VLM、MLLMなど、次々と登場する新...

RAGは検索した情報を基に回答するため、投入するデータが不正確・古い・不十分だとLLMの性能に関わらず出力の質が低下し、ハルシネーションの原因に 情報の「正確性...

RAGの回答精度は、参照するデータの品質が直接影響するため、データ前処理は「ハルシネーション」を防ぎ、検索の精度と速度を高めるための不可欠 効果的なデータ前処理...

NLWebは既存のウェブサイトを、自然言語での対話が可能なAIエージェント型インターフェースへと変換するオープンソースプロジェクト RAG(検索拡張生成)システ...

Claude for ChromeはChromeで動作するAIがWebページを直接操作し、カレンダー予約などを自然言語だけで自動化 安全性に配慮し、攻撃成功率を...