
完全自動運転に必要なAI技術は?画像認識から世界モデルの仕組み・課題を徹底解説!
米国では、すでに50近い企業が自動運転の公道走行を実施し、年間550万km以上の実績となっている自動運転市場。実は、画像認識や動画認識を中心としたさまざまなAI...
生成AI、画像認識、AI開発企業等のAI会社マッチング支援サービス

米国では、すでに50近い企業が自動運転の公道走行を実施し、年間550万km以上の実績となっている自動運転市場。実は、画像認識や動画認識を中心としたさまざまなAI...

企業のAI活用が加速するなか、LLM(大規模言語モデル)が業務効率化の重要ツールとして注目を集めています。しかし、LLM、VLM、MLLMなど、次々と登場する新...

Claude 3.7 Sonnetは「標準モード」と「拡張思考モード」を切り替えられるハイブリッド推論型モデルで、迅速な応答と深い論理的思考を両立できる。 コー...

Googleは2025年9月9日、強力なAI検索体験である「AIモード」の日本語での提供を順次開始すると発表した。 Gemini 2.5のカスタムバージョンを使...

Google社が開発した動画生成AIが「Veo」です。OpenAI社の動画生成AI「Sora」の対抗馬として公開され、注目を集めています。 Veoは、幅広い動画...

マルチモーダルAIは、テキスト・画像・音声など複数の異なるデータを統合的に処理できる技術 画像付きの問い合わせへの自動応答による顧客体験の向上、映像と音声を組み...

Project Marinerは、自然言語の指示でChromeブラウザを直接操作するAIエージェント 基盤モデルGeminiにより、Webページ上のテキストや画...

2024年12月、GeminiなどのLLM(大規模言語モデル)を提供し続けてきたGoogleが、新たに企業向けのAIエージェント構築プラットフォーム「Googl...

Movie Genはテキストだけで最大16秒・1080pの動画と最大45秒の音声を一貫生成し、既存映像の編集や人物写真からの動画化にも対応 人間評価でRunwa...

AIエージェントは、AI(人工知能)を活用して、ユーザーの音声指示やテキスト入力に応じてタスクを実行したり情報を提供したりするソフトウェアプログラムで、多くの企...