生成AI、画像認識、AI開発企業等のAI会社選定支援
コンシェルジュサービス

記事一覧

VLMの記事一覧

VLMとは?画像認識と自然言語処理を統合処理する仕組み・メリット・デメリット・活用分野を徹底紹介!

VLMとは?画像認識と自然言語処理を統合処理する仕組み・メリット・デメリット・活用分野を徹底紹介!

VLM(Vision Language Model)は、画像認識AIやLLM(大規模言語モデル)が組み合わさった技術として、ビジネスにおいて幅広い応用が期待され...

LLM・SLM・VLM・MLLM・LVM・LMMなどの重要用語の意味と違いが分かる!重要な生成AIモデル種類紹介

LLM・SLM・VLM・MLLM・LVM・LMMなどの重要用語の意味と違いが分かる!重要な生成AIモデル種類紹介

企業のAI活用が加速するなか、LLM(大規模言語モデル)が業務効率化の重要ツールとして注目を集めています。しかし、LLM、VLM、MLLMなど、次々と登場する新...

IBM、Granite大規模言語モデル(LLM)ファミリーの次世代モデル「Granite 3.2」を発表

IBM、Granite大規模言語モデル(LLM)ファミリーの次世代モデル「Granite 3.2」を発表

IBMは2025年2月26日、Granite大規模言語モデル(LLM)ファミリーの次世代モデル「Granite 3.2」を発表した。 新モデルは推論機能や画像処...

Llama3.2とは?Llama3との違いは?各モデルの概要・メリット・企業での活用シーンを徹底解説!

Llama3.2とは?Llama3との違いは?各モデルの概要・メリット・企業での活用シーンを徹底解説!

Meta社が提供するLLM「Llama3.2」は、2024年9月にリリースされました。そのわずか2カ月前に「Llama3.1」が発表されたばかりですが、そのLl...

Sakana AI、新手法「TAID」を用いた小規模日本語言語モデル「TinySwallow-1.5B」の公開

Sakana AI、新手法「TAID」を用いた小規模日本語言語モデル「TinySwallow-1.5B」の公開

Sakana AIは2025年1月30日、新しい知識蒸留手法「TAID」を用いて開発した小規模日本語言語モデル「TinySwallow-1.5B」を発表した。 ...

NTT東日本「AI Wi-Fi」提供開始、ネットワーク運用自動化

NTT東日本「AI Wi-Fi」提供開始、ネットワーク運用自動化

NTT東日本は2025年1月29日、AI技術を活用した次世代Wi-Fiソリューション「BizDrive AI Wi-Fi」を2025年2月3日より提供開始すると...

NECが生成AIで作業改善を自動指導

NECが生成AIで作業改善を自動指導

NECは2025年1月29日、映像解析技術と生成AIを組み合わせ、作業現場での改善アドバイスを自動生成する新技術を発表した。お手本動作と実際の作業の違いを映像か...

【AI論文解説】LLaVA-CoT: Let Vision Language Models Reason Step-by-Step:VLMに段階的な推論力を与えるLLaVA-CoT

【AI論文解説】LLaVA-CoT: Let Vision Language Models Reason Step-by-Step:VLMに段階的な推論力を与えるLLaVA-CoT

近年、LLM(大規模言語モデル)は推論能力で大きな進歩を遂げていますが、画像とテキストを扱うVLM(Vision Language Model)は複雑な視覚的質...