最終更新日:2024-09-23
アノテーションとは?AI開発での必要性・種類・作業手順徹底解説!
AI(人工知能)開発に欠かせない存在のアノテーション。しかし、「アノテーションとは?」「どうして必要なの?」「どうやってやるの?」と思う方も少なくないかもしれません。
そこで今回は、
AIシステムを自社で導入・開発する際の流れをこちらの記事で詳しく説明していますので併せてご覧ください。
また、AI Marketでは
アノテーション代行会社をご自分で選びたい方はこちらで特集していますので併せてご覧ください。
目次
アノテーションとは?
アノテーションとは、AIに学習させたいデータに意味付け(タグ付け)を行う作業のことをいいます。一般的には、教師データ作成とも言われ、AI開発における非常に重要な役割をもっています。AIは教師データによって学習され、その学習をもとにアウトプット(推論)をおこなうため、アノテーションの精度によってAIの精度が変わるといっても過言ではありません。
AIシステム開発の工程では、以下の位置にあります。
- データ収集
- アノテーション(意味づけ)
- 学習・モデル構築
- 評価
- 運用
AI開発では、画像やテキストなどのデータに意味を持たせてAIに学習させることできます。特定の物体の分析や抽出作業も可能です。
データ収集の代表的手法、コツをこちらの記事で詳しく説明していますので併せてご覧ください。
教師データとは?
教師データとは、AIに学習させるためのタグ付けが行われているデータのことを指します。アノテーションとは、元となるタグ付けされていないデータに対してタグ付けを行い、教師データを作成することを指します。その教師データをもとにAIは学習を行い、ルールやパターンを見つけて、タグ付けが行われていないデータを見ても予測して正解を導き出すことができるようになります。
例えばAIに、犬であることが既に分かっている画像を見せ、「これが犬」という答えを教師データとしてAIに学習させます。複数の教師データをAIに教えることで、初めて見る犬の画像を見ても「これは犬です」と認識させることが可能になるのです。教師データは、AI学習のために欠かせない存在と言えるでしょう。
アノテーションの対象となるデータは、主に画像・動画、音声、テキストの3分野に分類されます。
画像アノテーションに使用するデータセット(教師データ)の種類、収集する際の注意点については、こちらの記事で詳しく解説しています。
AIシステムでのアノテーションの目的
アノテーションの役割や目的について紹介します。
AIモデルの精度を高める
アノテーションは、基本的には教師データを作成した分だけAIモデルの精度を高めてくれます(過学習と呼ばれる技術的な問題はありますが、ここでは割愛します)。自動運転など高精度が求められている場合は、大量のドライブレコーダーの動画や、画像から人や周りの他の自動車など障害物をたくさん学習させなければなりません。
AIで実現したいことがあれば、どれくらいの精度のAIを開発したくて、達成のためにどれだけのデータが必要かを考えることが大切でしょう。
効率化とコストの削減
アノテーションをしっかり行ったAIは高品質で、決められた仕事であれば人間よりも早く仕事を終わらせることが可能です。そのため、業務効率化や人件費などのコスト削減が実現可能になってきます。
また、これまで手動でやっていたことが自動化によって人的ミスも少なくすることもできるようになります。例えば、工場の生産ラインで製品の不良品検出も画像認識で行うことができ、AIに良品と不良品の画像データを学習させれば、人よりも精度の高い検品をしてくれます。
アノテーションの種類①画像・動画
画像や動画のアノテーション作業はAIの学習において広く行われています。自動車の自動運転、商品の不良品検出や建造物などの外観検査などが代表的で、実用するためにはアノテーションした画像や動画をAIに学習させなければいけません。
アノテーションの対象となるデータは、主に画像・動画、音声、テキストの3分野に分類されます。
画像・動画のアノテーションは、主に以下の5種類に分類されます。
- 物体検出(バウンディングボックス)
- 領域抽出(セグメンテーション)
- 多角形で領域指定(ポリゴンセグメンテーション)
- 目印を検出(ランドマークアノテーション)
- 画像分類
それぞれを説明します。
物体検出(バウンディングボックス)
物体の検出は、画像や動画に映っているものを検出して言葉に意味を付ける手法です。画像にある物体をひとつひとつアノテーションツールを用いて長方形(バウンディングボックス)で囲み、その物体が何かをタグ付けします。
自動運転など、街中の画像や車道の画像などをイメージする方も多いでしょう。
しかし、これに限らず、例えば請求書やレポートといった帳票画像の中から、どの項目が取引先で、どの項目が金額なのか、などを学習させるために、そういった帳票の項目の物体検出を行う際にもバウンディングボックスでアノテーション作業を行ったりします。
また、バウンディングボックスには2D/3Dといった種類もあり、2Dといったは上述したような四角形で領域を設定する頂点が4つのアノテーションですが、3Dでは直方体の形となり、頂点を8つ持つより立体的なアノテーション作業となります。
関連記事:「バウンディングボックスとは?活用手法例・メリット・活用分野・注意点を徹底解説!」
領域抽出(セグメンテーション)
セグメンテーションとは、特定の領域を選択して、タグ付けを行う作業です。領域の抽出は、物体検出のようなバウンディングボックスで囲む手法と違い、特定の物体だけを抽出します。
例えば、人と犬の画像から犬のデータを抽出したいとき、犬だけの領域を指定してタグ付けを実施。
最近では、アノテーションツールを使用して、物体の輪郭情報を自動的に検出し、物体の領域を補正することで教師データの作成が可能になることもあります。
セマンティックセグメンテーションの仕組みについてこちらの記事で解説していますので併せてご覧ください。
多角形で領域指定(ポリゴンセグメンテーション)
ポリゴンセグメンテーションは、バウンディングボックスとセマンティックセグメンテーションの中間に位置するようなアノテーション作業です。画像の中の物体の領域を多角形で囲うアノテーション作業です。
複雑な形状の物体に対して多角形で領域を指定する形でアノテーションを行うことで、正確に領域をアノテーションすることが可能です。
目印を検出(ランドマークアノテーション)
ランドマークアノテーションは、顔の認識によく使われるアノテーション作業で、目、眉、鼻、口、輪郭といった顔のパーツを点で指定する形で行うアノテーション作業です。
顔認識のランドマークアノテーションでは、その点を設置する数によって細部までの表現度が変わってきますが、20〜100箇所ほどに対してアノテーションを行う形が多いです。
この細かなアノテーションを行うことで、顔の表情から感情を特定するなどが可能となります。表情認識AIと呼ばれ、正確なアノテーションによって喜怒哀楽や興味を示している度合といった微妙な心の動きを読み取ることが可能です。企業内のストレスチェックや空港などの入国審査で活用されています。
キーポイントアノテーションという派生型もある
また、ランドマークアノテーションの一種で、キーポイントアノテーションと呼ばれるアノテーション作業もあります。
キーポイントアノテーションとは、人物の姿勢推定モデルによく活用されるアノテーション作業で、画像内の人物の肩、肘、腰、膝といった関節点にキーポイントを当てるアノテーション作業になります。
骨格を検出することで、人物が座っている、立っている、寝ているといった姿勢を特定できるようになります。最近では、野球やゴルフなどのフォームを分析する際などにも活用され、スポーツの世界でよく利用されているアノテーションです。
どちらのアノテーション作業も目印に対してアノテーション作業を行う、という意味では同じですが、一般的に、顔認識にランドマークアノテーション、姿勢推定にキーポイントアノテーション、といった形で言われています。
画像分類
画像の分類は画像1枚にタグ付けを行う手法です。犬の写真に対して、「犬かどうか」などのタグ付けを行えます。
自動運転、ドローン、ロボットなどさまざまなものに利用されており、分類された画像を学習したAIモデルで、画像や動画を効率的に分類でき、例えばSNSに投稿された動画やテレビの映像などから特定のシーンを検出するといったことも可能になっています。
アノテーションの種類②音声
音声アノテーションでは、音声データに教師データとしてその音声をテキスト化したものをタグ付けします。AIに膨大なタグ付けされた音声データを学習させることで、タグ付けされていない音声データを聞かせた時に音声を認識し、テキスト化できるようになります。
高精度な音声認識システムを実現するためには、年齢や性別によってさまざまなパターンの話し方を考慮しなければなりません。
教師データのない音声データを認識させたときに、出力されたテキストが正しいかどうかを確認し、仮に認識率が低くても、再度アノテーションの実施、再学習を行うことで精度が向上し、正確な音声認識ができるようになります。
音声アノテーションの使用事例:コールセンター
近年では、議事録の書き起こしや翻訳などビジネスでも音声認識システムがよく利用されています。例えば、コールセンターではオペレーターが顧客とスムーズに応対できるためにマニュアルを検索する必要があります。
音声認識システムを用いて顧客の会話をテキスト化し、AIがテキストの意味を読み取ることで、マニュアルの回答を自動的に表示してくれます。これにより、サービスの品質向上や顧客満足度の向上が可能になりました。
他にも音声アノテーションは、自然言語解析とも非常に密接な関係のため、書き起こした文章を元に、テキストアノテーションを行うこともあります。
AI Marketでは、専門のコンサルタントが御社に適切なコールセンター向けシステム開発会社を無料で選定します。
喫緊でコールセンターへのAIシステム導入を検討されている方は、こちらでコールセンター向けおすすめAIサービスを紹介していますのでご覧ください。
アノテーションの種類③テキスト
テキストアノテーションでは、指定されたテキスト情報に対して、その意味を人が解釈して、指定されたラベルにタグ付けを行う自然言語処理のアノテーション作業です。
具体的には、特定の文章の背後にあるラベルを「意図的分類(依頼なのか指示なのか等)」「感情的分類(ポジティブかどうか等)」「意味的分類(何についてなのか)」で分類していく作業です。
大量の文章や単語を読み込むことで、ニュース記事などのカテゴリの分類を自動で行うことができたり、音声認識システムでテキスト化された情報から顧客データ(名前、年齢、住所、電話番号など)の抽出ができるようになったりします。
実際の作業としては、文章全体に対してのタグ付けもあれば、文章の一部毎に「人物について」「歴史について」などを意味づけしていくアノテーション作業も存在します。
「ドナルド・トランプ」という単語に対して「人」と分類を行ったり、「ラグビーワールドカップ2019」という単語に対して「イベント」とタグ付けを行ったりする形です。
より深ぼったアノテーション作業になると、上記のような一般的な解釈だけでなく、研究論文の文章を元に特定●学に属する文献かどうか、をタグ付けするようなアノテーション作業もあります。
テキストアノテーションの使用事例:チャットボット
テキストのアノテーションが用いられている例としてチャットボットがあります。チャットボットはテキストの意図を理解して自動応答する機能があります。
例えば、顧客がホテルをキャンセルしたいときのお問い合わせパターン。
- ホテルの予約をキャンセルしたいけど、どうしたらいい?
- ホテルの予約をキャンセルしたいけど、料金はいくら?
- ホテルの予約をキャンセルしたら、料金はかかるの?
とそれぞれ「ホテル キャンセル」のワードがありますが、返すべき答えは違います。
このような場合でもチャットボットは意図を理解して回答することが可能です。意図抽出をAIができるようにするためには、複数の文章に対してのアノテーション作業などが必要となってきます。
AI Marketでは
アノテーションの作業手順は?
アノテーションの基本的な手順を示すために、画像アノテーションを行う際の一般的な手順を以下に示します。
準備: アノテーションの実施体制を決める
アノテーションを実施する方法は、主に以下3つです。ただし、アノテーションする対象の数や品質、また医療画像のアノテーションなど専門性の必要性なども鑑みて、方法を選択すると良いでしょう。
作業方法 | 概要 | どんな企業向け? |
---|---|---|
自社でアノテーションツール(内製)を使用 | VOTTなど、無料で提供されているアノテーションツールを利用して自社でアノテーションを行う | 自社にアノテーションを行うためのリソースがある |
アノテーションを代行会社へ外注 | 自社でアノテーション行わずに、アノテーションを代行してくれる企業に依頼する |
|
データ収集のみ外注 | アノテーション対象となるデータの収集のみを依頼する方法。 | 自社・他社のアノテーション実施有無を問わない |
近年、無料で使用できるアノテーションツールも非常に多く出ています。無料ツールとアノテーションサービスを有効活用し開発を進めていくのもよいでしょう。
自社の開発環境や体制を考慮しながら、適した実施方法を選択ください。
アノテーション業務をインハウス(内製)で行う方法、工程、注意点についてはこちらの記事で分かりやすく解説しています。
アノテーション対象の画像データを準備する
まず、アノテーションを行いたい画像データを収集し、アノテーションツールに取り込める形式に整えます。画像の解像度や品質にも気を付けましょう。
アノテーションに必要なデータとは?
構築したいAI(人工知能)モデルによって、必要となるデータの種類が変わります。
- 画像認識モデル:識別対象となる画像
- 自動運転(画像認識)のモデル:車から撮影した映像ファイル
- 顔認識のモデル:顔写真の入った画像ファイル
- 建造物の劣化具合を識別するモデル:サビや傷の入った建造物の画像ファイル
- 自然言語解析(NLP):対象となる文章
- 音声認識モデル:対象となる音声データ
- 予測モデル:関連する数値データ
- チャットボット用の言語認識モデル:チャットコミュニケーションで発生する口語文章
このように、構築したいモデルに合わせてインプット対象となる元データを集めていきます。収集する具体的なデータ種類についてはこちらの記事をご覧ください。
アノテーションツールを選定する
目的に合ったアノテーション機能を持つツールを選びます。バウンディングボックス、セグメンテーション、ラベル付けなど、必要な機能があるか確認しましょう。また、使いやすさや導入のしやすさ、出力形式なども考慮します。
アノテーションの基準を決める
画像内のどの部分に、どのようなアノテーションを行うのかの基準を予め決めておきます。物体の種類や範囲、ラベルの付け方などを明確にし、作業者間で認識を統一することが大切です。
実際にアノテーション作業を行う
選んだツールを使って、画像にアノテーションを付けていきます。手動で行う場合は、マウス操作などでアノテーション範囲を指定し、ラベルを付けます。半自動や自動の機能がある場合は、それらを活用しながら効率的に進めましょう。
アノテーション結果の確認と修正を行う
付けたアノテーションに間違いがないか、もれがないかをチェックします。必要に応じて修正を行い、品質を担保します。できれば複数人でレビューし、精度を高めるのが良いでしょう。
アノテーションデータを出力する
完成したアノテーションデータを、AIモデル学習に使える形式で出力します。ツールの出力形式と、学習に必要な形式があっているか確認しておくのを忘れずに。
AI開発でのアノテーション作業の課題6ポイント
アノテーションはAI開発において非常に重要な役割を持っていますが、アノテーションを行う上では、以下のようなポイントがあります。
- 人的リソースの確保
- 作業時間の確保
- 専業スタッフか兼任スタッフか
- 収集するデータの種類
- データセットの量
- 明確なアノテーション要件
特に人材・リソース不足は大変な課題です。AI開発の知見を持つ人材はどの業界においても重宝されますが、最適な人材が少ないのが課題です。日々蓄積され、多種多様に変化していくビックデータを適切に取捨選択し活用していくのは安易なことではありません。
アノテーション専属の社員を育成するにも時間と労力がかかります。膨大なコストが発生するのも否めません。
おすすめのAI人材育成・人材教育サービスと選定のポイントの記事でAI人材育成・教育に関することを解説しています。
アノテーションについてよくある質問まとめ
- アノテーションとは?
アノテーションとは、AIに学習させたいデータに意味付け(タグ付け)を行う作業のことをいいます。一般的には、教師データ作成とも言われ、AI開発における非常に重要な役割をもっています。AIは教師データによって学習され、その学習をもとにアウトプット(推論)をおこなうため、アノテーションの精度によってAIの精度が変わるといっても過言ではありません。
- アノテーション作業はどのように進めるのですか?
アノテーション作業は通常、以下のような手順で進めます。
- アノテーション対象となるデータを収集・整理する
- 利用目的に合ったアノテーションツールを選定する
- どのようにタグ付けするかの基準を定める
- 実際にデータへのアノテーション作業を行う
- アノテーション結果の確認と修正を行う
- アノテーションデータをAI学習に使える形式で出力する 作業は自社で行う方法と、専門の代行会社に外注する方法があります。データ量が多い場合は外注も検討すると良いでしょう。
- アノテーション作業における課題にはどのようなものがありますか?
アノテーションを進める上での主な課題は以下の通りです。
- 人的リソースの確保(専任者の確保、教育等)
- 作業時間の確保(膨大なデータへのタグ付けには時間がかかる)
- 適切なデータセットの収集(AI開発目的に即したデータ収集が必要)
- 十分なデータセット量の確保(一定量のデータがないと学習できない)
- 明確なアノテーション基準の設定(品質のばらつきを防ぐ)
特にアノテーションに携わる人材の確保・育成とデータ量の確保が大きなハードルとなることが多いため、自社のリソースに合わせて外注も含めた体制構築を検討することが肝要です。
アノテーションがAI開発を左右する!
アノテーションはAI開発においてとても重要な役割を担っています。高精度のAIを作るためには、膨大なデータと正確な教師データが必要です。
ただし、自社だけでアノテーションを行った場合どうしても時間がかかってしまいます。そのため、アノテーションを専門で行っているアノテーション代行会社への相談も検討してみてはいかがでしょうか?
AI Marketでは
AI Marketの編集部です。AI Market編集部は、AI Marketへ寄せられた累計1,000件を超えるAI導入相談実績を活かし、AI(人工知能)、生成AIに関する技術や、製品・サービス、業界事例などの紹介記事を提供しています。AI開発、生成AI導入における会社選定にお困りの方は、ぜひご相談ください。ご相談はこちら
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
運営会社:BizTech株式会社
掲載記事に関するご意見・ご相談はこちら:ai-market-contents@biz-t.jp