生成AI、ディープラーニング等のAI会社選定支援
コンシェルジュサービス

記事一覧

マルチモーダルAIの記事一覧

ChatGPTとは?何ができる?ビジネス活用事例・企業担当者向け最新機能・使い方徹底解説!

ChatGPTは、OpenAIが2022年11月30日に公開してからわずか2ヶ月で月間のユーザー数が1億人を超え、現在多くのビジネスを変革しています。ChatGPTはLLM(大規模言語モデル)を基盤モ...

マテリアルズ・インフォマティクスとは?国内の成功例は?材料開発でのメリット・課題を解説!

材料開発分野のDXとして注目を浴びているマテリアルズ・インフォマティクス(MI)。しかし、共通のプラットフォーム開発が進んでいないことや、先端技術である「AI」を使うことや、膨大な蓄積データが必要であ...

パナソニックが国内最大級の企業専用AI開発。1,000億パラメータの自社LLMで業務革新へ

2024年7月2日、パナソニック ホールディングス株式会社とストックマーク株式会社は、パナソニックグループ専用の大規模言語モデル「Panasonic-LLM-100b」の共同開発を発表した。このモデル...

マルチモーダルAIとは?意味から身近な事例、ビジネスでの活用事例を詳しく紹介

AI(人工知能)の研究が急速に進められ、多くの業界で活用されるようになりました。中でも最近注目を集めているのが、自動運転や生成AI(ジェネレーティブAI)など最新の技術に使われている「マルチモーダルA...

Runway社、マルチモーダルでクリエイティブ用途に特化した次世代動画生成モデル「Gen-3 Alpha」発表

Runway社は、2024年6月17日、マルチモーダルなトレーニングを施した次世代の動画生成モデル「Gen-3 Alpha」を発表した。 同社は、米ニューヨークを拠点として生成AI動画作成モデルの開発...

GPT-4o(GPT4 omni)とは?何がすごい?OpenAIの与えた衝撃と活用方法を徹底解説!

OpenAIが開発した大規模言語モデルGPTシリーズの最新版、GPT-4o(オムニ)が2024年5月にリリースされました。テキスト、音声、画像を統合的に処理可能な最先端のマルチモーダルAIであり、無料...

Geminiとは?1.0や1.5の違いは?使い方・API・ChatGPTとの違いを徹底解説!

Geminiとは、ITの巨人Googleが満を持して2023年12月に公開した生成AIモデルです。ChatGPT以降、大手IT企業が生成AIに着目し、さまざまなサービスやアプリケーションを発表していま...

自動運転にAIが欠かせない理由とは?仕組みとメリット・デメリット徹底解説!

米国では、すでに50近い企業が自動運転の公道走行を実施し、年間550万km以上の実績となっている自動運転市場。実は、さまざまなAIの技術が、自動運転の根幹の部分として使われています。 一方、日本では、...

ChatGPTでの画像認識の使い方は?有料版のみ?GPT-4Vの画像読み込みが革新的な理由徹底解説!

ChatGPTは、テキスト生成だけに留まらず、画像認識という新たな領域へとその機能を拡張しています。いわば、生成AIが「眼」を持って世界を認識し始めたのです。企業はChatGPTの画像認識をどのように...

Google Bardとは?使い方は?ChatGPTの違い・活用方法を徹底解説!

近年、ChatGPTの登場から対話型AIをはじめとした生成AIが大手IT企業から各種登場しました。Google Bardとは満を持してGoogleが提供する対話型AIです。 生成AIはサービスによって...

1 2