記事一覧

マルチモーダルAIの記事一覧

Metaが2025年12月に音声分離特化の統合型AIモデル「SAM Audio」を発表テキスト・視覚・時間指定の3種類のプロンプトで目的の音を高精度分離環境...

2026年01月14日

機械学習プロジェクトを進めるに当たり、どのプラットフォームを利用すればよいかわからないと悩んでいる方もいると思います。本記事で紹介するVertex AIには、...

2026年01月14日

Claude 3.7 Sonnetは「標準モード」と「拡張思考モード」を切り替えられるハイブリッド推論型モデルで、迅速な応答と深い論理的思考を両立できる。コー...

2025年12月02日

ACPは、異なるフレームワークや環境で開発されたAIエージェント同士がHTTP/RESTベースで相互運用するためのオープンプロトコルツール接続に特化した「MC...

2025年11月25日

GrokipediaはGrokモデルによる記事生成とファクトチェックを一体化し、公開初日に88万件超の記事を提供読者による直接編集を制限し、提案型の編集ワーク...

2025年11月25日

Qwen3-LiveTranslateは18言語対応の多言語リアルタイム通訳モデルで、音声と映像を統合解析し文脈精度を向上入力から出力まで3秒以内の低遅延を実...

2025年11月25日

多くの企業が、AIの導入を検討する中で具体的な活用方法や効果に課題を感じています。特に、複雑な業務プロセスや大量のデータを扱う場合、既存のAIモデルでは十分な効...

2025年11月22日

Soraはテキストや画像から高品質な動画を生成・編集できるAI 指示（プロンプト）を与えるだけで、最長20秒、1080pの高解像度な動画を作成できるだけでなく、...

2025年11月07日

企業のAI活用が加速するなか、LLM（大規模言語モデル）が業務効率化の重要ツールとして注目を集めています。しかし、LLM、VLM、MLLMなど、次々と登場する新...

2025年10月06日

Google社が開発した動画生成AIが「Veo」です。OpenAI社の動画生成AI「Sora」の対抗馬として公開され、注目を集めています。 Veoは、幅広い動画...

2025年09月08日