記事一覧

マルチモーダルAIの記事一覧

マルチモーダルAIは、テキスト・画像・音声など複数の異なるデータを統合的に処理できる技術画像付きの問い合わせへの自動応答による顧客体験の向上、映像と音声を組み...

2026年07月24日

OpenAIが開発したLLM（大規模言語モデル）GPTシリーズの最新版、GPT-4o（オムニ）が2024年5月にリリースされました。テキスト、音声、画像を統合的...

2026年07月24日

画像と自然言語を同時に理解するマルチモーダル基盤モデル「CLIP」は、生成AI（ジェネレーティブAI）の進化とともに大きな注目を集めています。OpenAIが20...

2026年07月24日

ChatGPTは、OpenAI社が開発したLLM（大規模言語モデル）を基盤とする対話型AIであり、自然な文章生成、情報提供、多様なタスク実行が可能 GPTモデル...

2026年07月19日

米国では、すでに50近い企業が自動運転の公道走行を実施し、年間550万km以上の実績となっている自動運転市場。実は、画像認識や動画認識を中心としたさまざまなAI...

2026年07月12日

マテリアルズ・インフォマティクスは、実験データ、シミュレーションデータ、論文情報、物性評価結果などを活用し、材料開発の候補探索や物性予測を支援する手法材料開発...

2026年07月12日

ChatGPTから望む回答を得るには、質問の仕方（プロンプト）が重要であり、具体的で明確な指示が求められる。回答の質を高めるには、Few-Shotプロンプティ...

2026年07月12日

AIエージェントは、AI（人工知能）を活用して、ユーザーの音声指示やテキスト入力に応じてタスクを実行したり情報を提供したりするソフトウェアプログラムで、多くの企...

2026年07月09日

Google社が開発した動画生成AIが「Veo」です。OpenAI社の動画生成AI「Sora」の対抗馬として公開され、注目を集めています。 Veoは、幅広い動画...

2026年07月09日

機械学習プロジェクトを進めるに当たり、どのプラットフォームを利用すればよいかわからないと悩んでいる方もいると思います。本記事で紹介するVertex AIには、...

2026年07月09日