U-Netとは?画像認識に用いられる仕組み・他セグメンテーション手法との比較・メリット・活用分野を徹底解説!
画像認識におけるセマンティックセグメンテーション分野で多く活用されているモデルの一つがU-Netです。 医療画像診断から自動運転、製造業の品質管理まで、U-Netは高精度な画像セグメンテーションを実現...
生成AI、画像認識、AI開発企業等のAI会社選定支援
コンシェルジュサービス
画像認識におけるセマンティックセグメンテーション分野で多く活用されているモデルの一つがU-Netです。 医療画像診断から自動運転、製造業の品質管理まで、U-Netは高精度な画像セグメンテーションを実現...
生成AI、特にLLM(大規模言語モデル)の活用で頻繁に耳にするハルシネーション(幻覚)とは、AIがもっともらしい(まるで正しいかのような)嘘を生成する自称を指し、ChatGPT等の生成AI(ジェネレー...
人工知能(AI)、特に生成AIの進化は驚異的で、その中心にいるのは間違いなくChatGPTとMicrosoft Copilot(旧:Bing AI Chat)です。これら二つのAIは現在、企業のビジネ...
生成AI(ジェネレーティブAI) 技術は、クリエイティブな分野で注目を集めており、画像生成の可能性を大きく広げています。その中でメイン画像だけでなく、背景画像の作成にAIを活用する企業や個人も増えてい...
Google PaLM 2とはGoogleが開発したLLM(大規模言語モデル)です。もともとはGoogle PaLMとして2022年4月にGoogleが発表した言語モデルから2023年5月にアップデー...
写真や動画をとることなど、娯楽目的で使用されることも多いドローンですが、近年ではビジネスシーンでも多く活用されるようになってきました。ドローンだけで空中を飛べるよう、AI(人工知能)技術を効果的に利用...
本論文では、コード生成に特化した高性能なLLM(大規模言語モデル)であるOpenCoderを提案しています。 現在、多くのコードLLMが商用であり、そのデータやトレーニング手法が非公開である中、Ope...
近年、ディープラーニングモデルの大規模化に伴い、プライバシーやセキュリティに関する懸念が高まっています。特に、テキストと画像の両方を扱う大規模マルチモーダル言語モデル(MLLM)において、特定の個人情...
ステレオカメラは、物体の立体感や距離を把握できる距離センサの一種です。製造業の外観検査や自動運転技術、ロボティクスなど、画像認識など、さまざまな分野で活用が検討されています。 本記事では、ステレオカメ...
Diff Transformerは、Transformerの注意メカニズムが不要な文脈に過度に集中し、重要な情報を見逃しがちな問題に対処するために開発されました。 Diff Transformerは、...