記事一覧

LLM（大規模言語モデル）の記事一覧

LLMは従来のシステムと異なり、継続的に評価し改善を繰り返す「育てる」視点が不可欠正確な評価はIT部門の技術的視点だけでは不可能。業務部門の利用実感、経営層の...

2025年09月25日

LLMの評価は応答速度や精度などの技術的指標だけでなく、「ROI」や「顧客満足度」といったビジネスインパクト、「ユーザーの使いやすさ」など複数の視点 LLMを「...

2025年09月26日

近年、ChatGPTに搭載される「GPT」やAnthropicの提供するClaudeなどのLLM（大規模言語モデル）の活用が進む中で、ハルシネーションなどの問題...

2025年09月26日

LLMの性能は、公開ベンチマークの数値だけでなく、「定量」「定性」「AIによる評価」という3つの異なる視点を組み合わせて多角的に評価自社の活用シーン（ユースケ...

2025年09月26日

LLMをビジネスで活用する際、自動評価では測れない「品質」を担保するために人による評価が不可欠評価の目的を明確にし、正確性や一貫性といった評価項目、5段階など...

2025年09月29日

LLMの性能評価には、単語の一致率を測る伝統的な指標（BLEU, ROUGE）から文脈や意味の近さを捉える指標（BERTScore, LLM-as-a-Judg...

2025年09月29日

ChatGPTに搭載されているOpenAIのGPTモデルなど、クローズドなLLM（大規模言語モデル）が圧倒的なシェアを有する状況ですが、企業のユニークなニーズに...

2025年10月04日

VaultGemmaは2025年9月12日に公開された差分プライバシー（DP）でゼロから学習したLLMでプライベートAI開発の基盤となるプライバシーを優先した...

2025年10月04日

Codexは、OpenAIが開発したソフトウェア開発特化型エージェントで、コード生成やバグ修正、テスト実行を高精度かつ安全に行う。 CodexはChatGPTや...

2025年10月05日

VLM（Vision Language Model）は、画像認識AIやLLM（大規模言語モデル）が組み合わさった技術として、ビジネスにおいて幅広い応用が期待され...

2025年10月06日

« 1 … 4 5 6 7 8 … 11 »