最終更新日:2024-09-06
AIによる画像認識の導入活用事例15選を徹底解説
AI(人工知能)の機能の1つに、「画像認識」があります。AIの画像認識では、これまで実現できなかったレベルの、画像の意味を理解する、ということまで可能になっています。
また、AI画像認識は、一般の人が想像しているより深く、普段の生活に根づいています。なんとなく便利になっていたと思ったら、その陰にAI画像認識が活躍していた、といったことは珍しくありません。
この記事では、なぜAIを搭載したコンピュータが、画像データや画像情報から、その画像が持つ意味を理解できるようになったのか解説し、さらに、AI画像認識の15の事例を紹介します。
画像認識とは何か?どんな種類があるか?こちらの記事で分かりやすく解説しています。
また、AI Marketでは
画像認識・画像解析のAI開発に強い!プロ厳選の開発会社の記事では、画像認識・画像解析に強いおすすめのAI開発会社を厳選して紹介しています。AI開発会社選定のポイントも解説していますので、導入を検討している方はぜひご覧ください。
目次
AI画像認識の導入活用事例15選
AI画像認識技術がすでに人々の生活に深く浸透していることがわかる事例を紹介します。
コンビニの無人化
コンビニ各社は無人店舗の開発にしのぎを削っています。労働人口の減少で店員のアルバイトを確保しづらくなり、「オーナー=店長」の労働時間を減らさなければならないからです。コンビニの無人化において、AI画像認識技術が重要な役割を果たしています。
無人コンビニに入る客はまず、入口に設置してあるカメラに自分の顔をかざして顔認証を受けます。顔の画像情報と個人情報が一致すると、入店できます。店のなかに入った人物を特定できるので、その客が万引きを働いても追跡できます。
無人コンビニの店内には数十台ものカメラが取り付けられ、客がどの商品を手に取ったのかを撮影します。そして客は、購入する商品を無人レジのカメラにかざして、スマホで決済(支払い)をして店を出ます。
顔認証で撮影した画像、商品をピックアップする様子の画像、無人レジの商品画像、これらをすべてAI画像認識で解析して、個人情報と結合したり、在庫管理したり、決済情報と結合したりします。
AI画像認識技術がないと、無人コンビニは成立しません。
こちらでAIを活用した無人店舗の仕組みと事例を詳しく説明しています。
アマゾンGo
ネット通販世界最大手のアマゾンは、アマゾンGoという無人店舗を運営しています。アマゾンGoも、先ほど紹介した無人コンビニと同じAI画像認識技術を使っています。
そしてアマゾンGoは、それ以外の技術も使っているので紹介します。
アマゾンGoで特筆すべき点は、レジすらないことです。無人レジではなく、レジレスです。
アマゾンGoに入店できるのは、アマゾンのアカウントを持ちアマゾンGoのアプリをスマホにダウンロードしている人だけです。
客は、購入する商品を、自分のエコバックに入れていきます。そして出口に設置してある機器にスマホをかざせば、それで店を出ることができます。
エコバックに入った商品は、AI画像認識が把握しています。AI画像認識の情報が決済システムに送られ、スマホ決済が完了するわけです。
無人コンビニには「客が購入する商品を無人レジの機器にかざす」というアクションが必要でしたが、アマゾンGoはそれが要りません。
無人店舗モノタロウAIストア
モノタロウは、株式会社モノタロウが運営する工具専門のネット通販サイトです。そのモノタロウに、リアル店舗の、無人店舗モノタロウAIストアが登場しました。
客は事前に、モノタロウ店舗のアプリを自分のスマホにダウンロードしておかなければなりません。これはアマゾンGoと同じです。
客は、アプリのバーコード読み取り機能で、購入する商品のバーコードを読み取ります。買う商品が決まったら、「決済」ボタンを押します。これでスマホ決済されます。
ここまではAI画像認識は使われていません。
無人店舗モノタロウAIストアで使われているAI画像認識は、店舗内の様子の解析で使用されています。
来店者の人数や属性などを分析し、データ化することで、マーケティング分析に活用することができます。
がん細胞の種類を判別
大阪大学大学院医学系研究科は2018年に、AI画像認識技術を使って、がん細胞の種類を判別することに成功しました。
研究チームはまず、マウスのがん細胞と、人のがん細胞と、放射線治療が効きにくい人のがん細胞を用意して、それらを特殊な顕微鏡で写真撮影しました。
写真の枚数は、3種類のがん細胞とも、各10,000枚です。
続いて、計30,000枚のがん細胞の写真をAIに学習させました。マウスのがん細胞を学習させることで、AIは「マウスのがん細胞と人のがん細胞との違い」と「マウスのがん細胞と放射線治療が効きにくい人のがん細胞との違い」を学びます。
さらにAIは「人のがん細胞と放射線治療が効きにくい人のがん細胞との違い」も学びます。
このAIで別のがん細胞の写真を判別させたところ、正答率は98%でした。
この「98%」という数字は「医師が判別するより正確」というレベルになります。
小売店の売上と顧客満足度を向上させる
パナソニックは2019年に、AI画像認識技術で、小売店の売上と顧客満足度の両方を向上させる仕組み「Vieureka」をつくりました。
Vieurekaの1号店はドラッグストアです。店内に96台のAI画像認識カメラを設置して、客を撮影します。
通常のシステムはここで、カメラが撮影した動画をクラウドに送信して、クラウド上でAI解析するのですが、Vieurekaではそれをしません。店内に設置したAI画像認識カメラ自体が、店舗運営に必要な情報を処理してしまいます。
「必要な情報」とは例えば、客の性別、年齢層、棚の前を通った客の数、客の歩く速度などです。
ドラッグストア側は、これらの情報から、売れる棚づくりや、店内レイアウトや商品の陳列方法の改善、効率的な業務進行などを考えることができます。
これまでは、店長や店員の経験と勘で店づくりをしていましたが、Vieurekaを使えば、エビデンス(科学的根拠)に基づいた店舗運営ができるようになります。
その結果として、売上増や顧客満足度の向上を実現することができるようになるでしょう。
薬局で活用できるAIの種類、活用事例についてはこちらで解説していますので併せてご覧ください。
また、薬局を含む小売店で活用するAIで開発実績豊富な会社をこちらの記事で特集しています。
アパレル企業の流行予測をアシスト
IT企業のニューラルポケットが2019年に、アパレル企業の業務を効率化するシステムを開発しました。
ニューラルポケットは、AI画像認識を使って、ファッション関連の画像をインターネットで大量に集めて、ファッショントレンドを分析しています。
ニューラルポケットはこのデータを使って、これから流行する色や着丈を予測します。こうした情報をアパレル企業に提供することで、アパレル企業は「より確実に」次の流行を把握することができます。
アパレル企業は独自にファッショントレンドを調査して、流行を予測して、衣服などをつくっています。流行予測が外れれば、服は売れません。
「より確実な」流行予測は、アパレル企業の経営に大きく影響すると言えるでしょう。
コンクリート構造物の老朽化対策
キヤノンが開発した「インスペクション EYE forインフラ」は、橋やトンネルなどのコンクリート構造物の点検作業を支援するシステムです。株式会社東設土木コンサルタントと有限会社ジーテックが開発した変状展開図・管理支援ソフト「CrackDraw21」とデータ連携しています。そのため、点検調書作成や補修計画の策定などの実務展開も容易です。
EYE forインフラは、「撮影」「画像処理」「変状検知」の3つで構造物の老朽化の程度を判定します。AI画像認識は、変状検知で使います。画像処理した構造物の写真からひび割れなどの老朽化のサインを見つけ出します。実験では、ひび割れを99%の確率で検知しました。また0.05mmの微小なひび割れも、AI画像認識は見逃しませんでした。
コンクリートのひび割れ検知に用いるAIの活用事例について、こちらの記事で特集していますので併せてご覧ください。
倉庫の運営を最適化
三菱地所は、倉庫の運営を最適化する技術を、AI画像認識を使って開発しました。
実験で使った倉庫では、無人の自動搬送車が往来していました。倉庫内を監視カメラでこの無人自動搬送車や作業員の動きを撮影し、AI画像認識にかけます。
動線によって非効率になっている箇所や、作業員や無人自動搬送車の無駄な動きなどを確認しました。
三菱地所はこれらの分析結果から、倉庫の運営を最適化する方法をまとめ、倉庫会社にコンサルティングサービスとして提供しています。
海氷領域を抽出
海氷の領域をAI画像認識技術で抽出する研究が進んでいます。北海道網走市などの海岸には、冬の時期、流氷が漂着します。流氷などの海の氷のことを海氷といいます。
海氷は船の航行にとって重大な障害物なので、海氷領域を特定(抽出)することは、極寒の海での事故を予防するうえで欠かせません。海氷領域を抽出する方法には、実際に船で航行して人が目視する船舶観測の他、沿岸からの観測や航空機による観測があります。そして人工衛星から海を観測する方法もあります。
人工衛星による海氷の観測は、一気に広範囲に調査できる、継続して観測できる、といったメリットがありますが、人工衛星が撮影する画像は不鮮明になるという欠点がありました。そこでAIの専門家が海氷領域抽出研究に加わり、人工衛星が撮影した画像の解析を試みました。
この研究成果はまだ報告されていませんが、次のような課題がみつかっています。
- AI画像解析は、専門家による海氷領域の判読をどの程度支援できるのか
- 地上での海氷観測を使わず、人工衛星撮影とAI画像解析だけでどの程度判定できるのか
原油タンクの残量確認
産油国のなかには、自国の原油の貯蔵量を、実際より多く報告したり少なく報告したりする国があります。産油国の原油の貯蔵量は世界の原油取引価格に大きな影響を与えるため、正確な量は「どうしても明かしたくない」情報であり「どうしても知りたい」情報です。
そこでアメリカのAI企業が、人工衛星が撮影した産油国の原油タンクの写真をAI画像解析にかけ、貯蔵量を割り出すことに成功しました。
原油タンクの「蓋(ふた)」はタンク内の原油の上に浮いているので、原油の量が増えると持ちあがり、減ると下がります。AI画像解析技術が、蓋の位置から原油の量を推定するわけです。
最適なカロリーを算出
ライフログテクノロジー株式会社が、これから食べる食事の写真を撮るだけで、カロリーがわかるスマホ・アプリ「カロミル」を開発しました。
健康管理にはカロリー制限が欠かせませんが、カロリー計算は難しく、誰でも気軽にできるものではありません。
カロミルにはAI画像認識技術が搭載されており、食事の写真から「この食材のこのメニューのこの量なら○キロカロリー」と推定します。カロリー値はデータとしてアプリに蓄積され、グラフで推移を確認することができます。
広告を活用した来場効果
サッカーJリーグ二所属する名古屋グランパスエイトは、入場者の「顔パス」システムを導入しました。
事前にチケットを購入していた人がスタジアム入口のAI顔認証の機器に顔をかざすと、入場が可能になります。混雑防止にも役立ちますし、転売防止策にも繋げることが可能です。
万引き防止
AI画像認識は、小売店の監視人にもなります。万引き犯は、店内で独特な行動を取ります。AI画像認識に万引き犯の動きの特徴を学ばせて、実際に店内を撮影した動画を分析させます。
するとAI画像認識は、万引きしそうな人を特定します。その情報は店員のスマホに送信され、店員はその人に声かけをすることができます。
この段階では店員は、もちろん、単に「お探しの商品はなんですか」といった、何気ない会話をするだけです。この画像認識による万引き防止サービスである「AIガードマン」は、NTT東日本が提供しています。
関連記事:「AIは警備・セキュリティ業界をどう変える?活用方法・メリット・事例を徹底解説!」
全自動でパンを識別するレジ(アンデルセン/ブレイン)
ベーカリー大手アンデルセンでは、AIによる画像認識を使った株式会社ブレインの全自動レジBakeryScanを導入しています。トレイ上のパンの種類・値段をAIカメラで分類するシステムです。
関連記事:「AIの画像分類とは?活用方法・導入手順・注意点を徹底解説!」
包み紙やビニールで放送されていない状態はバーコードを印字できません。それで、店員は商品の価格を記憶するか、一つ一つリストと照合していかなければなりませんでした。BakeryScanはディープラーニングを使ってパンの画像を学習して、トレイの上に置かれたパンの種類と個数を認識して自動計算します。
このシステムにより、新人スタッフであっても勤務初日で即戦力として活用できます。また、入力時間を半分近くに短縮できたのでお客様を店内で待たせることも少なくなりました。
こちらの記事で、画像認識を含む飲食業界でのAI活用事例について説明しています。
墜落制止用器具フック不使用者を自動検知(株式会社日立ソリューションズ)
株式会社奥村組と株式会社日立ソリューションズは、画像認識AI(人工知能)技術の活用による、墜落制止用器具(安全帯)のフック不使用者を自動検知するAIモデルを構築・検証し、十分な性能を有することを確認したことを公表しました。
本AIモデルは、複数現場で収集した延べ6,000件以上の画像を事前に学習させたものとなっており、建設現場のカメラ映像から親綱支柱や親綱、フックを検出し、フックが親綱にかかっていない不使用状態を自動で判定(特許出願中*2)します。
今回、埼玉県にある鉄骨建方中の建設現場において、本AIモデルの検証を行い、カメラと対象の作業員の距離が15m以内、かつ人や物が重なっていないという条件下において、フック不使用者を90%以上の精度で正しく認識できること*3を確認しました。
関連記事:「株式会社日立ソリューションズ、墜落制止用器具フック不使用者を自動検知するAIモデルを構築・検証」
AIによる画像認識とは
画像認識とは、画像のなかの物体を、コンピューターが識別することができる技術を言います。例えば、猫の写真が目の前にあったとき、それを見て「猫である」と識別するすることです。
AI画像認識は、さまざまな分野にいる人たちから注目されています。IT以外の分野でも小売、ネットビジネス、医療、アパレル、インフラ、海洋などの分野が、AI画像認識を使って新たな挑戦をしています。
AIに学習させたい画像データに、「猫である」と意味付け(タグ付け)を行う作業のことをアノテーションといいます。一般的には、教師データ作成とも言われ、AI開発における非常に重要な役割をもっており、アノテーションによってAIによる画像認識の精度が変わるといっても過言ではありません。AIによる画像認識を開発する上で非常に重要となってくるアノテーションの代表的な手法、実施方法、注意点についてはこちらの記事で分かりやすく解説しています。
コンピュータはこれまで、画像認識が苦手でした。なぜなら「全身毛に覆われていて、4つ足で歩いているもの」は、猫以外にもたくさん存在するので見わけられなかったのです。AIを活用した画像認識技術が、コンピュータにとってのこの難問を解決しました。
回転寿司店などの外食産業での迷惑行為防止に活用されている、AIによる動画解析も実は画像認識・解析技術をベースとしています。
動画解析の仕組み、活用事例についてこちらの記事で解説しています。
AI画像認識の歴史:機械学習からディープラーニングまで
画像認識技術の歴史は1980年代に遡ります。画像認識の中心的な課題として研究が進められたのが、写された画像に人が映っているか機械学習で判別することでした。
このために有効な手法として開発されたのが「Viola-Jonesフレームワーク」です。この手法では画像を縦横の線で小さな矩形に切り、それぞれの区画の光の反射を測定して濃淡のマッピングを行います。これにより画像内の暗色部分と明色部分が区分けできます。それぞれの位置関係から以下のように顔のパーツを認識していきます。
- 暗色部分が集中しているエリア:目、口、髪
- 明色部分:鼻筋、頬、額
いったん学習してしまえばAIは正確に早く処理ができるため、リアルタイムの作業が可能です。しかし、この方法でAIに顔を認識させるには非常に多くの顔画像を読み込ませる必要があります。学習にかかる期間が長くなるのが欠点です。
関連記事:「AIを活用した画像認識の得意・不得意分野・企業導入での課題と対応策は?」
その後の画像認識技術の研究は長らく続けられていましたが、2010年代に、AIを活用した画像認識技術の登場で、画像認識技術が一気に注目されるようになりました。このAIを活用した画像認識の進化のスピードがこの時期に急加速したのは、このあと紹介するディープラーニングという技術が開発されたためです。
最近は、一般的な画像を迅速に読み込み理解するために、ディープラーニング(深層学習)の手法が用いられるようになっています。
初心者の方向けに、AIとは何か?ディープラーニングと機械学習の違い、導入されている分野をわかりやすく解説している記事はこちらです。
ディープラーニングとAI画像認識
2012年に、ILSVSと呼ばれる画像認識の精度を競う国際コンテストで、ディープラーニング技術を使用したチームが圧倒的成果で優勝し、ディープラーニング技術に注目が集まるようになりました。ディープラーニングとは、「ラベル付けされた大量のデータ」から「何層にもわたって判断を重ねて」「特徴量を割り出し」正解を導き出す技術です。
猫の写真を渡して、瞬時に「これは猫である」という結論を出した場合、入力層(猫の写真を見る)と出力層(猫と結論づける)の2層しかありません。従来の機械学習では2層で結論を出すことができませんが、ディープラーニングでは、ある層では「茶色だから猫の可能性がある」と判断し、別の層では「大人の人間より大きいから猫ではない可能性が相当高い」と判断します。ディープラーニング型AIは層が多いほど、つまりディープになるほど、正しい答えを出しやすくなります。
機械学習とディープラーニングの違い、使い分けるポイント、実際の活用事例についてこちらの記事で解説していますので併せてご覧ください。
AI Marketでは
AI画像認識で用いられるCNNとは?
ディープラーニングでよく用いられるのがCNN (Convolutional Neural Network) です。日本語では「畳み込みニューラルネットワーク」と呼ばれます。
CNNは画像データを細かなグリッドで分け、グリッドに「畳み込み」ながら、周辺のグリッドとの関係を「プーリング」と呼ばれる技術で読み取る手法です。不要な情報を取り除くと同時に、画像の特徴化を進めることができます。
「畳み込み」と「プーリング」を繰り返すことでAIが画像中の物体の構成を学習します。
こちらの記事で、CNN(畳み込みニューラルネットワーク)の仕組みについて解説しています。
ディープラーニングは自社での自動設計も可能?
AI画像認識に革新的な進歩をもたらしたディープラーニングですが、そのディープラーニング自体も進化しています。三菱電機は2016年に、世界で初めて、ディープラーニングを自動で設計する技術を開発しました。
例えば工場で生産性を上げるためにディープラーニングを導入しようとしても、ほとんどの場合、現場にはディープラーニングの知見がありません。そこで工場は、今抱えている課題をディープラーニングの専門家に説明して、ディープラーニング型AIをつくってもらう必要があります。しかし、ディープラーニングの専門家は工場の実務を知らないので、現場で使えるAIをつくるには、何度も工場と相談しなければなりません。
「三菱電機の方法」なら、学習データだけで、自動でディープラーニングをつくります。工場はもう、ディープラーニングの専門家の力を借りなくて済むのです。「三菱電機の方法」は、「ディープラーニングの自動設計アルゴリズム」といいます。
アルゴリズムとは、正解を導き出すまでの手順や計算方法という意味です。つまり「ディープラーニングの自動設計アルゴリズム」は、学習データだけで、ディープラーニングを生み出す、特殊な計算方法というわけです。
AIによる画像認識の導入についてよくある質問まとめ
- AI 画像認識技術はどのような分野で活用されていますか?
AI 画像認識技術は以下のような分野で活用されています。
- 小売業(無人店舗、商品識別)
- 医療(がん細胞の判別)
- 建設・インフラ(コンクリート構造物の点検)
- セキュリティ(顔認証、万引き防止)
- 農業・海洋(海氷領域の抽出)
- 製造業(品質管理)
- AI 画像認識技術の中核となる「ディープラーニング」とは何ですか?
ディープラーニングとは以下の通りです。
- 多層のニューラルネットワークを使用した機械学習の一種
- 大量のデータから自動的に特徴を抽出し学習する
- 従来の機械学習より高い精度で複雑なパターンを認識できる
- 画像認識の分野で革新的な進歩をもたらした技術
- AI 画像認識技術を導入する際の課題や注意点は何ですか?
AI 画像認識技術導入時の主な課題や注意点は以下の通りです。
- 大量の学習データ(画像)が必要
- データの質と多様性が重要(偏りのないデータセット)
- 専門知識を持つ人材の確保
- プライバシーや倫理的な配慮
- 導入コストと運用コストの検討
- 既存システムとの統合や連携
まとめ~AI画像認識はこれからさらに身近な存在になる
AIによる画像認識は今、人々が思っている以上に普段の生活に根づいています。そして、これからさらに身近な存在になるでしょう。例えば無人コンビニが普通のコンビニのように全国すみずみに広がるには、まだ時間がかかりそうです。しかし、AIは大きな発明が誕生すると一気に進化することがあるので、ある日を境に生活が一気に変わる可能性があります。
AI画像認識は、人の能力に例えると、視覚情報を得て、視覚情報の意味を探る行為に該当します。いわば、コンピュータの「目」と「脳」になります。したがってAI画像認識技術が進化すると、驚くべき日常生活になるはずです。
AI Marketでは
AI Marketの編集部です。AI Market編集部は、AI Marketへ寄せられた累計1,000件を超える開発相談経験を活かし、AI(人工知能)に関する技術や、製品・サービスなどの紹介記事を提供しています。ご興味をお持ちの製品やサービスがありましたら、ぜひご相談ください。