記事一覧

マルチモーダルAIの記事一覧

Claude 3.7 Sonnetは「標準モード」と「拡張思考モード」を切り替えられるハイブリッド推論型モデルで、迅速な応答と深い論理的思考を両立できる。コー...

2025年05月28日

生成AIツール、特にChatGPTを始めとするLLM（大規模言語モデル）は、個人・企業で多く活用されています。企業においては、自社情報を参照したチャットを実現す...

2025年05月23日

AIエージェントは、AI（人工知能）を活用して、ユーザーの音声指示やテキスト入力に応じてタスクを実行したり情報を提供したりするソフトウェアプログラムで、多くの企...

2025年05月23日

機械学習プロジェクトを進めるに当たり、どのプラットフォームを利用すればよいかわからないと悩んでいる方もいると思います。本記事で紹介するVertex AIには、...

2025年05月09日

画像と自然言語を同時に理解するマルチモーダル基盤モデル「CLIP」は、生成AI（ジェネレーティブAI）の進化とともに大きな注目を集めています。OpenAIが20...

2025年04月20日

画像認識の最前線で注目を集めるVision Transformer（ViT）。従来のCNNとは異なるアプローチで画像処理を行うこのモデルは、特に大規模データセッ...

2025年04月20日

製造現場での品質管理、セキュリティ、医療診断など、画像認識技術の活用は急速に広がっています。しかし、数多くのアルゴリズムの中から、自社の課題に最適なものを選ぶの...

2025年04月20日

近年、ChatGPTの登場から対話型AIをはじめとした生成AI（ジェネレーティブAI）が大手IT企業から各種登場しました。Google Bardとは満を持してG...

2025年03月28日

多くの企業が、AIの導入を検討する中で具体的な活用方法や効果に課題を感じています。特に、複雑な業務プロセスや大量のデータを扱う場合、既存のAIモデルでは十分な効...

2025年03月26日

Google DeepMindは2025年2月5日（現地時間）、Gemini 2.0の最新モデル群を発表した。 2.0 Flash、2.0 Pro、2.0 Fl...

2025年02月06日