生成AI、画像認識、AI開発企業等のAI会社マッチング支援サービス

記事一覧

LLM(大規模言語モデル)の記事一覧

LLM導入での評価体制構築で難しいのは?生成AI改善サイクルの運用フロー、自動評価を実現するポイントを徹底解説!

LLM導入での評価体制構築で難しいのは?生成AI改善サイクルの運用フロー、自動評価を実現するポイントを徹底解説!

LLMは従来のシステムと異なり、継続的に評価し改善を繰り返す「育てる」視点が不可欠 正確な評価はIT部門の技術的視点だけでは不可能。業務部門の利用実感、経営層の...

LLM導入での評価指標(KPI)種類は?生成AIを最大活用できる選び方・設定の落とし穴を徹底解説!

LLM導入での評価指標(KPI)種類は?生成AIを最大活用できる選び方・設定の落とし穴を徹底解説!

LLMの評価は応答速度や精度などの技術的指標だけでなく、「ROI」や「顧客満足度」といったビジネスインパクト、「ユーザーの使いやすさ」など複数の視点 LLMを「...

LLMをLLMで評価するLLM-as-a-Judgeとは?メリット・活用シーン・注意点を徹底紹介!

LLMをLLMで評価するLLM-as-a-Judgeとは?メリット・活用シーン・注意点を徹底紹介!

近年、ChatGPTに搭載される「GPT」やAnthropicの提供するClaudeなどのLLM(大規模言語モデル)の活用が進む中で、ハルシネーションなどの問題...

LLM(大規模言語モデル)の性能評価方法とは?指標設定方法・改善サイクル・注意点までLLMOpsサイクルを徹底解説!

LLM(大規模言語モデル)の性能評価方法とは?指標設定方法・改善サイクル・注意点までLLMOpsサイクルを徹底解説!

LLMの性能は、公開ベンチマークの数値だけでなく、「定量」「定性」「AIによる評価」という3つの異なる視点を組み合わせて多角的に評価 自社の活用シーン(ユースケ...

LLMの人手評価とは?評価基準設計方法、評価者育成方法、管理ポイント、ツール活用法を徹底解説!

LLMの人手評価とは?評価基準設計方法、評価者育成方法、管理ポイント、ツール活用法を徹底解説!

LLMをビジネスで活用する際、自動評価では測れない「品質」を担保するために人による評価が不可欠 評価の目的を明確にし、正確性や一貫性といった評価項目、5段階など...

LLMの自動評価の代表的指標は?評価ツール・ベンチマーク、タスク別の使い分けと限界を徹底解説!

LLMの自動評価の代表的指標は?評価ツール・ベンチマーク、タスク別の使い分けと限界を徹底解説!

LLMの性能評価には、単語の一致率を測る伝統的な指標(BLEU, ROUGE)から文脈や意味の近さを捉える指標(BERTScore, LLM-as-a-Judg...

オープンソースLLM15選!特徴・活用メリット・モデルの比較ポイントも徹底解説

オープンソースLLM15選!特徴・活用メリット・モデルの比較ポイントも徹底解説

ChatGPTに搭載されているOpenAIのGPTモデルなど、クローズドなLLM(大規模言語モデル)が圧倒的なシェアを有する状況ですが、企業のユニークなニーズに...

VaultGemmaとは?Google発のプライバシー保護LLMの性能や使い方、使ってみた結果まで徹底解説!

VaultGemmaとは?Google発のプライバシー保護LLMの性能や使い方、使ってみた結果まで徹底解説!

VaultGemmaは2025年9月12日に公開された差分プライバシー(DP)でゼロから学習したLLMでプライベートAI開発の基盤となる プライバシーを優先した...

【OpenAI】Codexとは?ソフトウェア開発を支援するAIエージェントの機能や特長、料金プランを徹底解説!

【OpenAI】Codexとは?ソフトウェア開発を支援するAIエージェントの機能や特長、料金プランを徹底解説!

Codexは、OpenAIが開発したソフトウェア開発特化型エージェントで、コード生成やバグ修正、テスト実行を高精度かつ安全に行う。 CodexはChatGPTや...

VLMとは?画像認識と自然言語処理を統合処理する仕組み・メリット・デメリット・活用分野を徹底紹介!

VLMとは?画像認識と自然言語処理を統合処理する仕組み・メリット・デメリット・活用分野を徹底紹介!

VLM(Vision Language Model)は、画像認識AIやLLM(大規模言語モデル)が組み合わさった技術として、ビジネスにおいて幅広い応用が期待され...

1 4 5 6 7 8 11