【AI論文解説】LLaVA-CoT: Let Vision Language Models Reason Step-by-Step:VLMに段階的な推論力を与えるLLaVA-CoT近年、LLM(大規模言語モデル)は推論能力で大きな進歩を遂げていますが、画像とテキストを扱うVLM(Vision Language Model)は複雑な視覚的質...2024年11月30日