記事一覧

マルチモーダルAIの記事一覧

ChatGPTはテキストだけでなく、画像、音声、ファイルなどを統合的に扱う「マルチモーダル機能」を備えており多様な業務を効率化画像生成、画像認識、音声・動画解...

2025年06月07日

ChatGPTから望む回答を得るには、質問の仕方（プロンプト）が重要であり、具体的で明確な指示が求められる。回答の質を高めるには、Few-Shotプロンプティ...

2025年06月07日

ChatGPTは、テキスト生成だけに留まらず、画像認識という新たな領域へとその機能を拡張しています。いわば、生成AI（ジェネレーティブAI）が「眼」を持って世界...

2025年06月07日

2024年12月、GeminiなどのLLM（大規模言語モデル）を提供し続けてきたGoogleが、新たに企業向けのAIエージェント構築プラットフォーム「Googl...

2025年05月30日

Geminiとは、Googleが満を持して2023年12月に公開したLLMです。Geminiはマルチモーダルで対話ができ、プログラミングにおいて高品質なコード生...

2025年05月30日

Claude 3.7 Sonnetは「標準モード」と「拡張思考モード」を切り替えられるハイブリッド推論型モデルで、迅速な応答と深い論理的思考を両立できる。コー...

2025年05月28日

生成AIツール、特にChatGPTを始めとするLLM（大規模言語モデル）は、個人・企業で多く活用されています。企業においては、自社情報を参照したチャットを実現す...

2025年05月23日

AIエージェントは、AI（人工知能）を活用して、ユーザーの音声指示やテキスト入力に応じてタスクを実行したり情報を提供したりするソフトウェアプログラムで、多くの企...

2025年05月23日

MCP（Model Context Protocol）は、LLMが外部ツールやデータソースと安全かつ柔軟に接続できるようにするオープンな標準プロトコルで、Cla...

2025年05月10日

PerplexityやSearchGPT、そしてGoogleのAI Overviewなど、検索エンジンに生成AIが搭載されたツールが増えています。従来の検索エン...

2025年05月10日