2019.03.03 04:24

2-1. 機械学習の3種類

機械学習の説明は、ディープラーニング検定教科書の記述をそのまま引用します。

機械学習とは、人工知能のプログラム自身が学習する仕組みです。コンピュータは与えられたサンプルデータを通してデータに潜むパターンを学習します。サンプルデータの数が多ければ多いほど、望ましい学習結果が得られます。

データに潜むパターンの学習なんですね。それでは、教師あり学習、教師なし学習、強化学習の3種類を押さえましょう！

2-1-2. 教師あり機械学習

教師データを使って予測値を正解ラベルに近づけることを目標に学習を行う手法です。データ間の関係性が分かります。

つきつめていくと、やることは「分類」と「回帰」の2つに収束します。いや、この2つだって、上手く分類できる線を引くか、上手くフィッティングできる線を引くか、といった違いでしかないので、つきつめていくと同じです。！

出力値の予測。代表的なものは線形回帰。線形回帰には単回帰分析と重回帰分析がある。深層学習でも回帰を行うことがある。

サポートベクターマシン、決定木、ランダムフォレスト、ロジスティック回帰、kNN法などの手法がある。深層学習でも分類を行うことができる。

教師データを使わずに、データの本質的な構造を浮かび上がらせる手法です。代表的な手法はクラスタリングと次元削減です。

例えばk-means法などで与えられたデータ群をいくつかのあつまり(クラスタ)に分けることで、データの本質的な構造を浮かび上がらせる手法。クラス分類とは異なるものなので、注意。

データの情報を失わないように、データを低い次元に圧縮する手法の総称。例えば、身長と体重から肥満度を表すBMIを計算する手法がイメージしやすいですね。主成分分析が、よく用いられる手法です。

収益(報酬の和)を最大化する方策を獲得することを目的とした手法です。以下の用語を覚えておきましょう

エージェント=ある環境で動くプレイヤー

状態=エージェントが置かれている環境

行動=エージェントがとる行動

収益=エージェントが行動することで得られる評価値

価値関数=将来的に得られる収益の期待値を表す関数。

方策=ある状態のとき、どの行動をとるべきかを示す関数。(決定的に決めるものと確率的に決めるものがある。)というか、方策は関数なのね。

Deep-Q-Network (DQN) =価値関数を計算するディープニューラルネットワーク。ディープマインド社が作った。これを使うものは深層強化学習と呼ぶ。

半教師学習という、教師あり学習におけるラベル付けのコストを低減するために用いられる手法もあるそうです。

0コメント

DUO Select 倶楽部

毎日1週DUO Select