
【AI論文解説】LLaVA-CoT: Let Vision Language Models Reason Step-by-Step:VLMに段階的な推論力を与えるLLaVA-CoT
近年、LLM(大規模言語モデル)は推論能力で大きな進歩を遂げていますが、画像とテキストを扱うVLM(Vision Language Model)は複雑な視覚的質...
生成AI、画像認識、AI開発企業等のAI会社マッチング支援サービス

近年、LLM(大規模言語モデル)は推論能力で大きな進歩を遂げていますが、画像とテキストを扱うVLM(Vision Language Model)は複雑な視覚的質...

2024年9月25日(現地時間)、Metaは最新のAIモデル「Llama 3.2」を発表した。この新モデルは、画像認識機能を持つ中型のLLM(11Bと90B)と...

本論文は、画像とテキストのマルチモーダル表現学習を向上させる新しいアプローチ「LLM2CLIP」を提案しています。 従来のCLIPモデルは、画像とテキストを共有...

Mistral AIは2024年11月18日(現地時間)、最新のLLM(大規模言語モデル)「Pixtral Large」と、無料チャットサービス「le Chat...

株式会社ココナラは、2024年11月18日(月)より、ビジネス向け業務サポートAIツール『ココナラAIスタジオ』の提供を開始した。 AIの専門知識がなくても直感...

NTTコミュニケーションズは2024年11月18日、tsuzumiなどのLLM(大規模言語モデル)を活用した次世代型セキュリティ運用支援ソリューション「AI A...

AI技術を自社事業に導入したい方、AIを自社サービスに取り込みたい方、自社のAI技術を広く世界で役立てたい方をマッチングするAIコンシェルジュサービス「AI M...

rinna株式会社は、2024年5月7日、Meta社のLLM(大規模言語モデル)「Llama 3 8B」の日本語継続事前学習モデル「Llama 3 Youko ...

2024年9月17日、日本発のAIスタートアップSakana AIが、シリーズA資金調達の一環として、日本の大手企業からの投資を受けたことを発表した。 三菱UF...

2024年11月14日に発表された調査によると、GitHubのAIコーディングツール「GitHub Copilot」などのAIツールが開発者の作業方法を大きく変...