生成AI、画像認識、AI開発企業等のAI会社選定支援
コンシェルジュサービス

記事一覧

マルチモーダルAIの記事一覧

マルチモーダルAIとは?身近な事例やビジネスでの活用事例を詳しく紹介

マルチモーダルAIとは?意味から身近な事例、ビジネスでの活用事例を詳しく紹介

マルチモーダルとは、テキストや画像、動画など複数の種類のデータを一度に処理できる技術を指します。複数の種類のデータを同時処理して複雑なタスクをAIが解析できる技...

Google DeepMind、Gemini 2.0の最新モデル群を発表

Google DeepMind、Gemini 2.0の最新モデル群を発表

Google DeepMindは2025年2月5日(現地時間)、Gemini 2.0の最新モデル群を発表した。 2.0 Flash、2.0 Pro、2.0 Fl...

AIによる図面作成とは?仕組み・活用メリット・ユースケース・活用事例を徹底紹介!

AIによる図面作成とは?仕組み・活用メリット・ユースケース・活用事例を徹底紹介!

人手不足や納期短縮の要請が強まるなか、図面作成業務の効率化は多くの企業が直面する課題となっています。設計図面の作成や修正に多くの時間を費やしてしまうことは業界共...

Veoとは?特徴・Soraとの違い・メリット・デメリットを徹底紹介!

Veoとは?特徴・Soraとの違い・メリット・デメリットを徹底紹介!

Google社が開発した動画生成AIが「Veo」です。OpenAI社の動画生成AI「Sora」の対抗馬として公開され、注目を集めています。 Veoは、幅広い動画...

自動運転にAIが欠かせない理由とは?仕組みとメリット・デメリット徹底解説!

自動運転にAIが必要な理由とは?仕組みとメリット・デメリット徹底解説!

米国では、すでに50近い企業が自動運転の公道走行を実施し、年間550万km以上の実績となっている自動運転市場。実は、画像認識や動画認識を中心としたさまざまなAI...

Google次世代AI「Gemini 2.0」が本格始動。マルチモーダル出力とエージェント機能が搭載

Google次世代AI「Gemini 2.0」が本格始動。マルチモーダル出力とエージェント機能が搭載

2024年12月11日(現地時間)、GoogleはAIモデル「Gemini 2.0」を発表した。昨年12月に発表したGemini 1.0から進化を遂げ、テキスト...

AI業界最新ニュース【AI Market人気記事2024年11月まとめ版】

AI業界最新ニュース【AI Market人気記事2024年11月まとめ版】

企業のAI活用が加速する中、最新のAI開発動向を把握し、自社のビジネスにどう活用できるかを検討することは、経営者や事業責任者にとって重要な課題となっています。 ...

画像認識アルゴリズムとは?各種類の特徴・選定ポイントを徹底解説!

画像認識アルゴリズムとは?各種類の特徴・選定ポイントを徹底解説!

製造現場での品質管理、セキュリティ、医療診断など、画像認識技術の活用は急速に広がっています。しかし、数多くのアルゴリズムの中から、自社の課題に最適なものを選ぶの...

Mistral AI、最新LLMと無料チャットサービスを発表。画像生成やウェブ検索など多機能な統合AIプラットフォームへ

Mistral AI、最新LLMと無料チャットサービスを発表。画像生成やウェブ検索など多機能な統合AIプラットフォームへ

Mistral AIは2024年11月18日(現地時間)、最新のLLM(大規模言語モデル)「Pixtral Large」と、無料チャットサービス「le Chat...

【AI論文解説】CLEAR: Character Unlearning in Textual and Visual Modalities:マルチモーダルAIにおける『忘れる技術』を評価する新たなベンチマークデータセット

【AI論文解説】CLEAR: Character Unlearning in Textual and Visual Modalities:マルチモーダルAIにおける『忘れる技術』を評価する新たなベンチマークデータセット

近年、ディープラーニングモデルの大規模化に伴い、プライバシーやセキュリティに関する懸念が高まっています。特に、テキストと画像の両方を扱う大規模マルチモーダル言語...

1 2 3 4