生成AI、画像認識、AI開発企業等のAI会社マッチング支援サービス

記事一覧

マルチモーダルAIの記事一覧

画像認識アルゴリズムとは?各種類の特徴・選定ポイントを徹底解説!

画像認識アルゴリズムとは?各種類の特徴・選定ポイントを徹底解説!

製造現場での品質管理、セキュリティ、医療診断など、画像認識技術の活用は急速に広がっています。しかし、数多くのアルゴリズムの中から、自社の課題に最適なものを選ぶの...

Vision Transformer(ViT)とは?画像認識を変える仕組み・CNNとの違い・メリット・限界を徹底解説!

Vision Transformer(ViT)とは?画像認識を変える仕組み・CNNとの違い・メリット・限界を徹底解説!

画像認識の最前線で注目を集めるVision Transformer(ViT)。従来のCNNとは異なるアプローチで画像処理を行うこのモデルは、特に大規模データセッ...

Clipとは?OpenAIの基盤モデルの技術やマルチモーダルの仕組み・活用事例・課題を解説!

CLIPとは?OpenAIのマルチモーダル基盤モデルの仕組み・活用事例5選・課題を徹底解説!

画像と自然言語を同時に理解するマルチモーダル基盤モデル「CLIP」は、生成AI(ジェネレーティブAI)の進化とともに大きな注目を集めています。OpenAIが20...

Vertex AIとは?できること・料金・連携できるGoogleサービスを解説!

Vertex AIとは?機能やできること・メリット・料金・連携できるGoogleサービスを解説!

機械学習プロジェクトを進めるに当たり、どのプラットフォームを利用すればよいかわからないと悩んでいる方もいると思います。 本記事で紹介するVertex AIには、...

Google DeepMind、Gemini 2.0の最新モデル群を発表

Google DeepMind、Gemini 2.0の最新モデル群を発表

Google DeepMindは2025年2月5日(現地時間)、Gemini 2.0の最新モデル群を発表した。 2.0 Flash、2.0 Pro、2.0 Fl...

Google次世代AI「Gemini 2.0」が本格始動。マルチモーダル出力とエージェント機能が搭載

Google次世代AI「Gemini 2.0」が本格始動。マルチモーダル出力とエージェント機能が搭載

2024年12月11日(現地時間)、GoogleはAIモデル「Gemini 2.0」を発表した。昨年12月に発表したGemini 1.0から進化を遂げ、テキスト...

AI業界最新ニュース【AI Market人気記事2024年11月まとめ版】

AI業界最新ニュース【AI Market人気記事2024年11月まとめ版】

企業のAI活用が加速する中、最新のAI開発動向を把握し、自社のビジネスにどう活用できるかを検討することは、経営者や事業責任者にとって重要な課題となっています。 ...

Mistral AI、最新LLMと無料チャットサービスを発表。画像生成やウェブ検索など多機能な統合AIプラットフォームへ

Mistral AI、最新LLMと無料チャットサービスを発表。画像生成やウェブ検索など多機能な統合AIプラットフォームへ

Mistral AIは2024年11月18日(現地時間)、最新のLLM(大規模言語モデル)「Pixtral Large」と、無料チャットサービス「le Chat...

【AI論文解説】CLEAR: Character Unlearning in Textual and Visual Modalities:マルチモーダルAIにおける『忘れる技術』を評価する新たなベンチマークデータセット

【AI論文解説】CLEAR: Character Unlearning in Textual and Visual Modalities:マルチモーダルAIにおける『忘れる技術』を評価する新たなベンチマークデータセット

近年、ディープラーニングモデルの大規模化に伴い、プライバシーやセキュリティに関する懸念が高まっています。特に、テキストと画像の両方を扱う大規模マルチモーダル言語...

OpenAIの新型推論モデル「o1」シリーズ、Azureで開発者・企業向けに提供開始

OpenAIの新型推論モデル「o1」シリーズ、Azureで開発者・企業向けに提供開始

2024年9月12日(現地時間)、MicrosoftはAzure OpenAI Service、Azure AI Studio、GitHub モデルにて、Ope...

1 2 3 4 5