
マルチモーダルAIとは?意味から身近な事例、ビジネスでの活用事例を詳しく紹介
マルチモーダルとは、テキストや画像、動画など複数の種類のデータを一度に処理できる技術を指します。複数の種類のデータを同時処理して複雑なタスクをAIが解析できる技...
生成AI、画像認識、AI開発企業等のAI会社選定支援
コンシェルジュサービス
マルチモーダルとは、テキストや画像、動画など複数の種類のデータを一度に処理できる技術を指します。複数の種類のデータを同時処理して複雑なタスクをAIが解析できる技...
Google DeepMindは2025年2月5日(現地時間)、Gemini 2.0の最新モデル群を発表した。 2.0 Flash、2.0 Pro、2.0 Fl...
人手不足や納期短縮の要請が強まるなか、図面作成業務の効率化は多くの企業が直面する課題となっています。設計図面の作成や修正に多くの時間を費やしてしまうことは業界共...
Google社が開発した動画生成AIが「Veo」です。OpenAI社の動画生成AI「Sora」の対抗馬として公開され、注目を集めています。 Veoは、幅広い動画...
米国では、すでに50近い企業が自動運転の公道走行を実施し、年間550万km以上の実績となっている自動運転市場。実は、画像認識や動画認識を中心としたさまざまなAI...
2024年12月11日(現地時間)、GoogleはAIモデル「Gemini 2.0」を発表した。昨年12月に発表したGemini 1.0から進化を遂げ、テキスト...
企業のAI活用が加速する中、最新のAI開発動向を把握し、自社のビジネスにどう活用できるかを検討することは、経営者や事業責任者にとって重要な課題となっています。 ...
製造現場での品質管理、セキュリティ、医療診断など、画像認識技術の活用は急速に広がっています。しかし、数多くのアルゴリズムの中から、自社の課題に最適なものを選ぶの...
Mistral AIは2024年11月18日(現地時間)、最新のLLM(大規模言語モデル)「Pixtral Large」と、無料チャットサービス「le Chat...
近年、ディープラーニングモデルの大規模化に伴い、プライバシーやセキュリティに関する懸念が高まっています。特に、テキストと画像の両方を扱う大規模マルチモーダル言語...