【AI用語解説】アノテーション
最終更新日:2022年09月03日
アノテーションとは
アノテーションとは、AI開発に必要な教師データを作成するために、画像や音声といったデータに対して、意味を付与する作業を指します。
何かしらの識別を目的とするAIモデルを構築するためには、教師となるデータ(教師データ)が必要となり、その教師データを作る工程の一部にアノテーションがある、と捉えるとわかりやすいかもしれません。
この教師データを作成するためには、元データの収集→意味づけ(アノテーション)、という工程に分かれます。
具体的には、以下のようなものが元データとなります。
- 自動運転を実現するためのモデル → 車から撮影された画像や映像データ
- 工場で製造した部品の中から欠陥品を識別するためのモデル → 部品画像データ
- 会議の音声認識を行い、音声からテキストを出力するモデル → 会議音声データ 等
その上で、上記の元データを収集した後に、目的に沿って元データを元に、以下のような対象に対して、意味づけ(アノテーション)作業を行います。
- 車から撮影された画像や映像データ → 障害となり得る他の車や標識、歩行者といった対象物
- 部品画像データ → 傷の箇所
- 会議音声データ → 発話された言葉
これら対象をアノテーションのする際の具体的作業は、目的に応じて、下記のように複数の手法があります。
作業種類 | 作業内容 | 目的 |
---|---|---|
Bounding Box (バウンディングボックス) | 画像の中の対象物エリアを四角形で囲う(2D/3D) | 物体の検出 |
Semantic Segmentation (セマンティックセグメンテーション) | 画像の中の対象物エリアをラベル毎に塗り潰し | 領域の抽出 |
Instance Segmentation (インスタンスセグメンテーション) | 画像の中の対象物エリアをラベル/個体に塗り潰し | 同一ラベル別個体を含めた領域の抽出 |
キーポイントアノテーション | 対象物の頂点を点でマーク | 物体の骨格(人体、表情)を検出 |
Sequence labeling (系列ラベリング) | 分割した単語ごとに意味づけ | テキストの意味抽出 |
分類 | 画像やテキストを意味ごとに分類 | 意味ごとにデータを分類 |
AI Marketの編集部です。AI Market編集部は、AI Marketへ寄せられた累計1,000件を超えるAI導入相談実績を活かし、AI(人工知能)、生成AIに関する技術や、製品・サービス、業界事例などの紹介記事を提供しています。AI開発、生成AI導入における会社選定にお困りの方は、ぜひご相談ください。ご相談はこちら
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
運営会社:BizTech株式会社
掲載記事に関するご意見・ご相談はこちら:ai-market-contents@biz-t.jp