生成AI、画像認識、AI開発企業等のAI会社マッチング支援サービス

記事一覧

LLMの記事一覧

Sakana AIのALE-Agent、AtCoder最適化プログラミングコンテストで804名を抑え初優勝

Sakana AIのALE-Agent、AtCoder最適化プログラミングコンテストで804名を抑え初優勝

Sakana AIが開発するAIエージェント「ALE-Agent」が2025年12月14日に実施されたAtCoder Heuristic Contest 058...

OpenAI、GPT-5.2-Codexをリリース、サイバーセキュリティ能力を大幅強化しプロレベルの脆弱性発見を実現

OpenAI、GPT-5.2-Codexをリリース、サイバーセキュリティ能力を大幅強化しプロレベルの脆弱性発見を実現

OpenAIは2025年12月18日、エージェント活用型コーディングモデルGPT-5.2-Codexをリリースした。GPT-5.2をコーディング向けに最適化し、...

ChatGPT vs Claude vs Gemini日本語能力を徹底比較!最も自然なのは?ビジネスに使える文章力・敬語力検証

ChatGPT vs Claude vs Gemini日本語能力を徹底比較!最も自然なのは?ビジネスに使える文章力・敬語力検証

生成AIの日本語は「正確さ」だけでは不十分で、自然さと、人間らしい温度感が鍵となる。 事務的なChatGPTには感情を、嘘をつきがちなClaudeには制約を、プ...

LLM活用でのリスク評価はなぜ必要?ベンチマークだけではなくハルシネーションやバイアスに対する耐性評価方法を徹底解説!

LLM活用でのリスク評価はなぜ必要?ベンチマークだけではなくハルシネーションやバイアスに対する耐性評価方法を徹底解説!

LLMを業務利用する際は、性能だけでなく、ハルシネーション(誤情報)やバイアス、セキュリティといった多様なリスクを総合的に評価 LLMのリスクを可視化するには、...

LLM(大規模言語モデル)の性能評価方法とは?指標設定方法・改善サイクル・注意点までLLMOpsサイクルを徹底解説!

LLM(大規模言語モデル)の性能評価方法とは?指標設定方法・改善サイクル・注意点までLLMOpsサイクルを徹底解説!

LLMの性能は、公開ベンチマークの数値だけでなく、「定量」「定性」「AIによる評価」という3つの異なる視点を組み合わせて多角的に評価 自社の活用シーン(ユースケ...

ChatGPT vs Claude vs Gemini ユーモア表現能力を徹底比較!日本語で最も面白いのは?

ChatGPT vs Claude vs Gemini ユーモア表現能力を徹底比較!日本語で最も面白いのは?

ユーモア表現では、正確さよりも文脈理解と温度感の調整力が結果を大きく左右する。 ChatGPT・Claudeは文章の安定性は高いが、ユーモアが控えめまたは説明的...

ChatGPT vs Claude vs Gemini 犯罪・暴力的表現など不適切な出力対応力を徹底比較!

ChatGPT vs Claude vs Gemini 犯罪・暴力的表現など不適切な出力対応力を徹底比較!

違法薬物製造や偏見助長といったリスクの高いプロンプトに対し、ChatGPTは「物語内で回避」、Claudeは「明確な生成拒否と迂回提案」、Geminiは「拒否と...

個別化医療とは?活用分野・AIを使う手法・導入事例を徹底解説!

個別化医療とは?活用分野・AIを使う手法・導入事例を徹底解説!

医療分野において、一人ひとりの患者に最適化された「個別化医療」の重要性が増しています。特に、がん治療や生活習慣病予防といった領域では、従来の画一的なアプローチで...

MetaがSAM Audioを発表、テキストや視覚プロンプトで音声分離を実現

MetaがSAM Audioを発表、テキストや視覚プロンプトで音声分離を実現

Metaは2025年12月16日、画像・動画のセグメンテーション技術SAMを音声領域に拡張したSAM Audioを発表した。テキスト、視覚、時間軸の3種類のプロ...

アドビがChatGPTでPhotoshop、Express、Acrobatの提供を開始

アドビがChatGPTでPhotoshop、Express、Acrobatの提供を開始

アドビは2025年12月11日、ChatGPT向けにAdobe Photoshop、Adobe Express、Adobe Acrobatの提供を開始した。週間...

1 8 9 10 11 12 53