機械学習の3種類、教師あり・教師なし・強化学習のアルゴリズム徹底解説
最終更新日:2024年12月18日
AI(人工知能)のビジネス活用が、すっかり一般的になってきました。その「AI」の技術で頻繁に使われる用語に「機械学習」という言葉があります。
昨今のAIブームをけん引し、ビジネスへのAI導入をもたらした立役者は間違いなく機械学習です。ニュースなどでも機械学習という言葉が頻繁に使われていることもあり、AI=機械学習と思われている方も多いようです。
しかし、実際は「AI=機械学習」ではありません。この記事では、
違いがわかれば、どの種類の機械学習を使えば良いかはっきりわかります。
AIの定義、種類、事業活用できる技術の種類についてこちらの記事で解説しています。
AI Marketでは、
貴社に最適な会社に手間なく数日で出会えます
目次
機械学習とは?
機械学習はAIを実現するための1つの技術で、コンピューターに大量のデータを読み込ませ、データの背景にあるパターンを発見する手法です。つまり、AIの1つの分野が機械学習です。
コンピューターに隠れたパターンを学習させることで、未知のデータを判断するためのルールを獲得するデータ解析技術です。主な手法に「ディープラーニング」や「教師あり学習」があります。
機械学習とディープラーニングは違う?
機械学習の発展形法が「ディープラーニング」(深層学習)です。機械学習(Machine Learning)では、一般的に特徴量を人間が定義します。特徴量とは、予測や分類に利用される変数です。例えば、ミカンとリンゴの画像を識別する場合「色」「大きさ」「へたの有無」が主要な特徴量となるでしょう。「色」「大きさ」「へたの有無」に注目しなさいとあらかじめ教えるのが機械学習です。
機械学習が発展した手法が「ディープラーニング」(深層学習)で、ディープラーニングではあらかじめ特徴量を人間が設定する必要がありません。ミカンとリンゴの画像を識別する場合「色」「大きさ」「へたの有無」が特徴量であることをコンピューターが自分で学習するのです。
ディープラーニングは、より高い精度で予測や分類ができます。しかし、学習のために膨大なデータセットを必要とします。
ビジネスにおいての機械学習とディープラーニングの使い分けポイント、活用事例についてこちらの記事で解説していますので併せてご覧ください。
機械学習と統計学の関係は?
機械学習も統計学も、大量のデータから隠れたパターンを見つけ出して普遍的な予想モデルを構築することでは同じです。機械学習は、統計学の理論を多く採用しています。
AIや機械学習と聞くと、何もないところから答えが飛び出るマジシャンの箱のようなイメージを持っている方も多いかもしれません。しかし、実は統計学に用いられているさまざまな理論を組み合わせています。ですから、機械学習は統計学の応用版と言うことも可能です。
ただし、統計学では、ある程度人間の一般的な感覚に近い説明変数で構成されたモデルが多く使われます。一方、機械学習、特にディープラーニングでは、人間が直感的には理解できない説明変数が含まれることがあります。
統計学者は、直感で理解できない変数がある場合、背後にあるルールを説明することに重きを置きます。一方、AI開発者はルールを解明することよりも、出来上がったモデルがより正確に予想することに重きを置く点が異なります。
AIモデルとは何か?どんな種類があるか?こちらの記事で詳しく説明していますので併せてご覧ください。
教師あり学習
教師あり学習は、正解となる答えが含まれた教師データをモデルに学習させる方法です。正解となる答えを「ラベル」、答えが含まれたデータを「教師データ」または「ラベル付きデータ」と呼びます。
教師あり学習は教師データを用いてモデルの学習をおこない、最終的にラベルのないデータを正解させるようにします。正解が明確である場合には教師あり学習を用います。
入力データと正解が含まれた出力データのペアが揃って初めて正解を推測するための手法です。ですから、正解となるデータの質と量が学習精度に影響を与えます。
教師あり学習のアルゴリズムは「分類」と「回帰」があります。分類はデータの属するクラスを予測すること、回帰はデータの連続する値を予測することです。
教師あり学習の活用方法についてこちらの記事で説明しています。
教師なし学習
教師なし学習は、与えられたデータの本質的な構造や法則をアルゴリズムが自動的に抽出する方法です。ラベルの付いた教師データを用意せずに、学習データのみをアルゴリズムに与えます。
教師なし学習は、データの特徴をおおまかに捉えることが目的です。ですから、一般的には教師なし学習より教師あり学習の方が学習精度は高く、実際には教師あり学習が用いられる機会が多いでしょう。
しかし、正解が不明確な場合には教師なし学習を用いるしかありません。例えば、まったく初めて開発する製品の市場規模を予想する場合は正解がありません。ですから、正解データを必要としない教師なし学習を利用します。
ディープラーニングは、教師あり学習と教師なし学習をシステムが用途・目的に応じて自動で使い分けます。
強化学習
強化学習は、最初から正解を与えずシステム自身が試行錯誤していきながら精度を高めて学習していく方法です。教師あり学習と似ていますが、与えられたデータを単に正解不正解で学習するのではなく、将来的に価値を最大化することを目指して学習させます。
ある環境の行動主体である「エージェント」が環境の状態に応じて行動することで、報酬をより多く得られるかを目指します。強化学習は、自動運転やゲームの対戦で主に用いられ、他にもレコメンド、異常検知、頻出パターンマッチングなどの分野でも活用されています。
強化学習の活用方法についてはこちらの記事で説明しています。
最近はディープラーニングと強化学習を組み合わせた、深層強化学習も活用されています。
教師あり学習の代表的アルゴリズム7選
教師あり学習の代表的アルゴリズムを紹介します。
- 回帰分析
- サポートベクターマシン(SVM)
- 決定木、ランダムフォレスト
- K近傍法
- ロジスティック回帰
- ナイーブベイズ(単純ベイズ)
- ニューラルネットワーク
それぞれを説明します。
回帰分析
回帰分析、特に線型回帰は一方が他方を左右する一方向の関係の分析をします。例えば、売上と来店客数、気温と販売数などの関係です。
予測したい変数を従属変数(目的変数)、他の変数の値を予測するために使用する変数を独立変数(説明変数)と呼びます。回帰分析は、モデル自体を解釈しやすいというメリットがあります。
サポートベクターマシン(SVM)
サポートベクターマシン(SVM)は、回帰・分類・外れ値の検出に用いられるアルゴリズムです。パターン認識の手法で、物事を分類します。
パターン認識とは、画像や音声などの膨大なデータから一定の特徴や規則性を取り出す処理です。特徴量の空間上で、2つのクラスとなるよう分けるための線型関数を求めるアルゴリズムです。
サポートベクターマシンには以下のメリットがあります。
- 少ないデータ量でも正しく分類しやすい
- データの次元が大きくなっても識別の精度が高い
- 最適化すべきパラメーターが少ない
決定木、ランダムフォレスト
決定木は、データから「木」構造の予測モデルを作る手法で、何らかの意思決定を助けるために活用されます。
ランダムフォレストは複数の決定木を集めたもので、多数決や平均を取ることで精度を向上させたアルゴリズムです。バギングと呼ばれる手法で、教師データから何回も抽出して少しずつ異なる決定木を作成し、決定木を複数にします。
K近傍法
K近傍法はパターン認識で用いられます。アルゴリズムはシンプルで、予測したい値を入力すれば、特徴量と近い距離にあるデータで多数決をとって結果を予測値とするアルゴリズムです。
与えられた学習データをベクトル空間上にプロットしておき、未知のデータが得られたら、そのデータに最も近いk個のデータを取得します。そして、その多数決でデータが属するクラスを推定します。
K近傍法は、特に小規模なデータセットに対しては高い精度を発揮します。
ロジスティック回帰
ロジスティック回帰は、複数の要因からイエスとノーのように明確に答えが二つになる値の「2値の結果」が起こる確率を説明します。多変量解析の手法の一つです。
分類問題を解くアルゴリズムで、線型回帰モデルを分類問題に対応できるように改良しました。入力が与えられたときに、どのクラスに分類されるかだけでなくどれくらいの確率で分類されるかを出力可能です。
マーケティングや医療分野など幅広い分野で利用されています
ナイーブベイズ(単純ベイズ)
ナイーブベイズ(単純ベイズ)は、分類問題を解くための教師あり学習の分類アルゴリズムの一つです。確率論の定理であるベイズ理論をもとにしています。
ナイーブベイズ(単純ベイズ)は、あるデータがどのクラスに属するか判定する手法です。
シンプルで計算量が少なく処理が高速であるため、大規模データや現実世界の複雑な問題にも対応できます。身近な例では、迷惑メールのフィルター機能やウェブニュース記事のカテゴリ分けに使われています。
ニューラルネットワーク
ニューラルネットワークは、人間の脳内の神経細胞であるニューロンのネットワーク構造を人工的に模したモデルです。入力層と出力層の間に中間層(隠れ層)を加えて、つながりを重みとしてパラメーターで調整します。
データ分析に用いるアルゴリズムをこちらの記事で一覧説明しています。
AI Marketでは、
貴社に最適な会社に手間なく数日で出会えます
教師なし学習の代表的アルゴリズム3選
教師なし学習のアルゴリズムで代表的なものを解説します。
- k-means法(クラスタリング)
- 次元削減、主成分分析(PCA)
- 自己組織化マップ(SOM)
それぞれを説明します。
k-means法(クラスタリング)
k-means法は、教師データを用いずに似たデータを集めて分類する非階層的なクラスタリング手法のアルゴリズムです。k-means法では、データを予め決めた数(k個)のクラスタに分けます。
k-means法は、データ量が多い場合でも計算速度が速いため、大規模なデータセットに適しています。ただし、クラスタの初期値の設定方法によっては、結果が大きく変わってしまいます。
他のクラスタリング手法と比べて理解しやすく、実装も比較的容易であるため初心者でも取り組みやすいとされています。
次元削減、主成分分析(PCA)
次元削減は、データを高次元から低次元へできるだけ情報は保ったまま変換するアルゴリズムです。高次元のデータだと直接確認できないため、可視化できるように次元を変換します。
次元削減のアルゴリズムとして代表的なのが主成分分析(PCA)です。特徴量を抽出することで、データセット内の特徴量が削減できます。
自己組織化マップ(SOM)
自己組織化マップ(SOM)は、ニューラルネットワークに基づいたクラスタリング手法の一つです。入力データの類似度をマップ上の距離で表現し、自動的に分類します。
人間が識別することが難しい高次元のデータでも中に存在する特徴を見つけクラスタリングが可能です。
データ分析に用いるアルゴリズムをこちらの記事で一覧説明しています。
強化学習の代表的アルゴリズム
強化学習の代表的なアルゴリズムを紹介します。
- モンテカルロ法
- Q学習
- SARSA
それぞれを説明します。
モンテカルロ法
モンテカルロ法は、乱数を用いた試行(実験)を繰り返すことにより妥当な答えを求める手法です。エージェントの行動の結果としてどのような報酬が与えられるか、不明な状態のときに用いられます。
エージェントがある行動をしたことで得られる報酬を順番にエピソードとして記録していきます。その後得られた報酬の平均を算出し、それぞれのエピソードが起こる期待値を出して、強化学習の報酬として活用可能です。
Q学習
Q学習とは、ある状態のある行動の価値をQテーブルと呼ばれるもので管理し、行動ごとにQ値を更新していく手法です。新たな行動を繰り返してQテーブルを埋めていき、その時点での価値が最大化できる行動を学習します。
Q学習にニューラルネットワークの考え方を含めた「DQN」という手法もあります。
SARSA
SARSAでは、現在の状態からエージェントがある行動をとった場合に報酬が与えられ、行動後の状態が確定します。その後エージェントはその状態を前提に、次に取るべき最適な行動を予測し行動します。この流れの繰り返しでAIが最適な行動パターンを学習したのがSARSAです。
Q学習と比べると、安全策を取りやすく、より多くの収益が獲得できる可能性があります。
データ分析に用いるアルゴリズムをこちらの記事で一覧説明しています。
ビジネスへの機械学習導入の注意点
ビジネスへ機械学習の技術を導入する際の注意点をまとめました。活用しようと考えている方はぜひ参考にしてください。
注意点 | 概要 |
---|---|
機械学習の活用が本当に必要か | ・コストがかかる場合もある ・欠点や注意点も検討した上で判断 ・機械学習自体が導入の目的にならないように注意 |
ブラックボックス化 | 導き出された結果の根拠がわからない |
教師データを確保できるか | ・必要な教師データが揃っているか ・データ量が不足していないか |
過学習 | コンピュータが手元にあるデータから学習しすぎて、結果予測がうまくできなくなる状態 |
フィードバックループ | アルゴリズムの判断が現実に影響を与えて、アルゴリズム自身の判断が正しかったと確信してしまうこと |
近年では、これら基本的な手法に加えて、より発展的な機械学習が注目されています。例えば、事前学習したモデルを別のタスクに応用する転移学習や、学習を加速し新しい環境に適応するメタ学習、複数モデルを組み合わせて精度を上げるアンサンブル学習、非常に少ないデータで学習するFew Shot Learning(フューショット学習)、学習データがない状態でも推論を行うZero Shot Learning(ゼロショット学習)などがあります。
また、ロボットや複雑なタスク設定において、何を考慮すべきか(有効な情報)と何を無視すべきか(無関係な情報)を明確化することが難しいフレーム問題に対処する取り組みも行われています。
さらに、学習済みモデル同士を統合するモデルマージや、モデルを軽量化して効率化するknowledge distillation(知識蒸留)などの技術も開発が進んでいます。
機械学習についてよくある質問まとめ
- 機械学習の3つの主要な種類とその特徴は何ですか?
機械学習の3つの主要な種類と特徴は以下の通りです。
教師あり学習:
- 正解ラベル付きのデータを使用
- 分類や回帰問題に適用
教師なし学習:
- ラベルなしデータからパターンを発見
- クラスタリングや次元削減に使用
強化学習:
- 試行錯誤を通じて最適な行動を学習
- 環境との相互作用から報酬を最大化
- 教師あり学習の代表的なアルゴリズムにはどのようなものがありますか?
教師あり学習の代表的アルゴリズムは以下の通りです。
- 回帰分析: 変数間の関係を分析
- サポートベクターマシン(SVM): データを
- 分類する境界を見つける
- 決定木・ランダムフォレスト: ツリー構造で決定ルールを学習
- K近傍法: 近いデータ点の多数決で分類
- ロジスティック回帰: 2値の結果を予測
- ナイーブベイズ: 確率論を用いた分類
- ニューラルネットワーク: 人間の脳を模した構造で学習
- 機械学習をビジネスに導入する際の主な注意点は何ですか?
機械学習のビジネス導入における主な注意点は以下の通りです。
- 機械学習の必要性の慎重な検討(コストと効果のバランス)
- ブラックボックス化への対応(結果の根拠が不明確になる可能性)
- 十分な量と質の教師データの確保
- 過学習(オーバーフィッティング)への対策
- フィードバックループの考慮(アルゴリズムの判断が現実に影響を与える可能性)
- 機械学習の導入自体が目的化しないよう注意
まとめ
本記事では機械学習の種類とアルゴリズムについて解説しました。
機械学習をはじめとしたAI技術はビジネスへの活用に大きなインパクトを与え、すでに多くの企業が導入を進めています。自社でも機械学習をビジネスで活用したいとお考えかもしれません。
しかし、
AIの専門用語、システム要件はわからないし、見積もりの内容チェック方法もわからない方がほとんどではないかと思います。
AI Marketでは、
貴社に最適な会社に手間なく数日で出会えます
AI Marketの編集部です。AI Market編集部は、AI Marketへ寄せられた累計1,000件を超えるAI導入相談実績を活かし、AI(人工知能)、生成AIに関する技術や、製品・サービス、業界事例などの紹介記事を提供しています。AI開発、生成AI導入における会社選定にお困りの方は、ぜひご相談ください。ご相談はこちら
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
運営会社:BizTech株式会社
掲載記事に関するご意見・ご相談はこちら:ai-market-contents@biz-t.jp