
目次
機械学習の活用は、人間では処理しきれない大量のデータを分析することを可能にします。また、社内システムに機械学習の技術を導入すると、業務の効率化やコスト削減などの効果が期待できます。そこで今回は、導入事例と合わせて機械学習とは何かについてご紹介します。
機械学習とは、AIの技術の1つ
AIに関連する事柄として、「機械学習」や「ディープラーニング」という言葉を目にすることは多いでしょう。しかし、それぞれの意味の違いを理解している方は多くありません。「機械学習」を中心にその言葉の違い、そして機械学習の重要性を解説します。
1.機械学習とは
機械学習とは、AIの要素技術の1つです。その内、機械学習はコンピューターに大量のデータを学習させ、データに潜むパターンやルールを発見させる技術です。また、機械学習に関連するものの1つとして「ディープラーニング」もあります。この2つは混同されがちですが、ディープラーニングは機械学習の手法の1つに過ぎません。ここで言葉の関係性をまとめると、「AI∋機械学習∋ディープラーニング」になります。
2.機械学習の重要性
そもそも、なぜ機械学習は重要視されているのでしょうか。その理由の1つに、「人間では実現不可能な短時間で、大量の複雑なデータを分析し、より正確な結果をより速やかに提供できる」点があります。もし大量のデータを人力で処理するとしたら、時間や人員の面で大変なコスト高になってしまいます。そのため機械学習は、迅速かつ正確な意思決定を導く強力なツールになります。
機械学習を導入することで解決できる課題
機械学習を活用した事例がニュースなどに取り上げられ、その活躍に関心を寄せている方も多いでしょう。しかし、どう活かせるかについては漠然としているのではないでしょうか。ここでは、機械学習を導入することで解決できる課題を紹介します。
1.売上
機械学習は売上の向上に役立てることができます。これまで経験や勘に頼っていた売上予測を明文化して、再現性を高められるでしょう。具体的な事例として、タクシーの配車予測システムが挙げられます。新人ドライバーでも高い精度の需要予測ができ、乗車率や売上の向上に繋がります。NTTドコモの実証実験では、4か月の間で売上が平均して1人1日あたり1,409円アップしたという結果が報告されています。
2.コスト
ビジネスでの機械学習の利用はコストカットにも貢献します。カスタマーサポートの現場ではチャットボットが導入されており、顧客からのお問い合わせをAIが代わりに行います。業務上の負荷の軽減や、人件費削減などが期待できます。
3.商品・サービスの質
AIの導入は効率性だけでなく、品質における信頼性の確保にも役立ちます。導入事例として凸版印刷とみずほ銀行は、企業ごとそれぞれの基準に合わせて、文章の校閲・校正を可能にする「AI校閲・校正支援システム」を開発しました。このシステムにより、確認者の負担軽減とヒューマンエラーによる見落としの減少を実現しています。
4.管理能力
AIは監視や管理の分野にも転用可能です。NTT東日本は、店内のカメラから買物客の行動を観察し、不審な行動を検知すると店員のアプリに通知するサービス「AIガードマン」を開発。この技術は、万引きによる被害を抑えられる他、万引き犯確保にかかるコストの減少にもつながります。
5.人員不足
さらにAIは人手不足の悩みも解決します。キューピーの工場では2019年より、原料の不良を検査する機械を運用し始めました。この機械の導入により、業務の熟練度による精度のバラつきや、作業上の高い負荷を解消しました。
機械学習・AI・ニューラルネットワーク・ディープラーニングの違い
機械学習について調べると、AI、ニューラルネットワーク、ディープラーニングなど似たような言葉に少し困惑する方もいるのではないでしょうか。ここからは、それぞれの違いを詳しく解説していきます。
1.AIとは
AIは正式名称をArtificial Intelligenceといい、日本語では人工知能と訳して呼ばれます。そして、人間が行う「学習・推論・認識・知覚・判断」といった活動を人工的に実現することを目指しています。今日のAIアプリケーションは「弱いAI」と分類されており、人間によって限定された事柄を学んでデータの処理を実行しています。
2.ニューラルネットワークとは
ニューラルネットワークは、人間の脳の動きをコンピューター上で模した数理モデルです。人間の脳は多数の神経細胞(ニューロン)があり、そこから出る電気信号によって情報を処理しています。この動きを数理モデルとして複数組み合わせたものがニューラルネットワークと言われています。
3.ディープラーニングとは
ディープラーニングとは、ニューラルネットワークを多層に結合して、表現・学習能力を高めた機械学習の一手法です。ニューラルネットワークの層を増やしていくことで、より複雑な関数表現や問題解決ができるのではないかという考えから生まれたものです。
4.それぞれの違い
ニューラルネットワークは、機械学習のアルゴリズムの1つになります。さらに、ニューラルネットワークを応用させたものがディープラーニングと呼ばれています。AIとの関係性を改めて整理すると「AI∋機械学習∋ニューラルネットワーク∋ディープラーニング」となります。
機械学習の手法は大きくわけると5つ
機械学習は複数の学習手法があり、代表的なものは以下の5つです。
- 教師あり学習
- 教師なし学習
- 強化学習
- 深層強化学習
- 半教師学習
以下では、それぞれの学習手法の内容とその違いを解説していきます。
1.教師あり学習
教師あり学習とは、あらかじめ「正しいデータ」がインプットされており、ある入力を受けたときに正しい出力を返せるアルゴリズムを構築する学習方法です。正解となる膨大なデータを学習することで、新しいデータへの対応も可能です。
2.教師なし学習
教師なし学習では、「正しいデータ」はインストールされていません。代わりにデータそのものが持つ構造・特徴を分析し、グループ分けやデータの簡略化をコンピューター自身が行います。
3.強化学習
強化学習とは、コンピュータ自らが試行錯誤をしながら、最適な答えを探す学習手法です。一連の行動をとった結果ごとに報酬を設定します。コンピューターはその報酬が最大化するよう、学習を行って精度を上げていきます。
4.深層強化学習
深層強化学習は「ディープラーニング」と、強化学習の一手法の「Q学習」を組み合わせたものです。「ディープラーニング」を利用すると、「Q学習」が次の行動の方針を決定する際に最善の行動を取れるようになり、学習時のコストや時間を多く削減できます。一般的な強化学習では学習コストが膨大になりがちですが、その課題を克服した手法が深層強化学習になります。
5.半教師なし学習
半教師なし学習は、教師あり学習と教師なし学習の中間に位置する手法です。一部のデータを人間の手によってラベル付けし、残りのラベルなしのデータをコンピュータに学習させるというものです。データのラベル付けにはその分野の専門家が必要な場合があり、費用が高くなってしまったり時間がかかってしまいます。その場合には、一部のみラベルを付与し、パターンや類似性を学習させて、残りはラベルなしのデータで学習を進めていくという手法が取られます。
機械学習で使われるプログラミング言語「Python」を解説
Pythonは、機械学習で最も使われるプログラミング言語の1つです。「少ないコードでプログラムを書けるシンプルさ」、「できることの多さ」、「使い勝手の良さ」、「専門的なライブラリやフレームワークの豊富さ」などの理由から人気を集めています。有名なWebサービスでも採用されており、YoutubeやInstagramにも用いられています。このようにプログラミング言語として、多数の企業やサービスへの導入実績に裏付けられた信頼性があります。もともとPythonは、コードを書きやすく読みやすくするために生まれたプログラミング言語のため、だれが書いても同じようなコードになるように作られています。
機械学習のアルゴリズム
機械学習ではアルゴリズムを使ってデータを分析します。アルゴリズムとは、「問題を解決するための手順や計算方法」を指す言葉です。機械学習のアルゴリズムは、大きく5つのカテゴリーに分けられます。
- 分析
- 回帰
- クラスタリング
- 次元削減
- 異常検知
ここからは、それぞれのカテゴリに属するアルゴリズムについて解説します。
1.分類
「分類」とは、分析したいデータが属するカテゴリーやクラス、種類が何なのかを判定する手法です。機械学習の手法の内の「教師あり学習」の1つで、データに「イヌ」、「ネコ」のようにラベルを付けて学習させ、そのラベルの情報やカテゴリーの情報などを分類・予測する際に使用します。
ランダムフォレスト
ランダムフォレストとは、決定木を多く作り、多数決を行って結果を出力する手法です。決定木とは、条件分岐によってグループを分割して分類する手法を指します。その際にグループがなるべく同じような属性で構成されるように分割。条件分岐を何度も繰り返し、決定木は解くべき最小単位まで分割されていきます。複数の決定木の結果を用い多数決を取ることで、精度の低い決定木があっても全体の精度を守ることができます。
ロジスティック回帰
ロジスティック回帰は、確率のような0から1の範囲に限定される目的変数に用いられるアルゴリズムです。実際にロジスティック回帰は、マーケティングキャンペーンの成功率の測定、特定の製品収益予測などの場面で使われています。
サポートべクターマシン
サポートベクターマシンは、分類・回帰の両方に利用可能な教師あり学習です。サポートベクターマシンはデータ分布を複数のクラスへ明確に分けるため、境界を引く手法です。識別能力が高く、精度が良い分析結果を出してくれることから人気の高いアルゴリズムになっています。
2.回帰
回帰の主な目的は、連続値などといった「値」の予測です。つまり、「これまでの実績データをもとに関連性を導き出し、これからの予測に役立てる」ための手法です。具体例として、曜日、天候などの情報を加味して来客数の予測を立てるケースがあります。来客数に限らず株価など、回帰は幅広い領域における数字の予測に利用されます。
線形回帰
線形回帰は、散らばったデータの分布を代表して、1本の直線で表現する技法です。
サポートベクターマシン
サポートベクターマシンは分類のパートでも登場しましたが、分類のときとは計算方法が大きく異なります。回帰においては、SVM分析に本当に必要なデータのみを上手に利用するという考えの下、予測結果の誤差をどう解釈するのかといった工夫が必要な場合があります。
サポートべクター回帰
サポートベクター回帰はサポートベクターマシンの回帰版です。SVRでは重みの最小化と誤差の最小化で学習を行います。誤差の小さい部分を無視して、分析結果のロバスト性を向上させています。
Elastic Net
Elastic Netは、ラッソ回帰とリッジ回帰という2つの回帰手法を合成した手法です。ラッソ回帰は不要な特徴量を削る特性をもち、リッジ回帰は過学習を防ぐ特性があります。Elastic Netは両者の特徴を程よく併せ持っており、予測性能が高い手法になっています。
3.クラスタリング
クラスタリングとは、分類の延長線上にある技法です。「似たデータの集まりを機能やカテゴリごとに分けて集める」という点で共通していますが、分類は「教師あり学習」なのに対し、クラスタリングは「教師なし学習」です。
階層クラスター分析
階層クラスター分析は階層構造のある分類方法です。最も似ているサンプル同士を1つずつ順番にグルーピングしていきます。似ているもの同士をクラスタとし、樹形図ができるまでグルーピングを繰り返します。そのため階層クラスター分析は、対象の少ないデータで実行するのに適しています。
非階層クラスター分析
非階層クラスター分析は階層構造のない分類方法です。母集団の中で近いデータをまとめて、事前に指定された数のクラスターに分類していきます。非階層クラスター分析は、ビッグデータなど大量のデータを実行するのに適しています。
4.次元領域
機械学習でもデータの特徴量が不必要に多いと、「次元の呪い」という現象が起こり、精度が悪くなります。データの次元を減らすことを目的に、次元領域のアルゴリズムが用いられます。
データの圧縮
「データの圧縮」とは、あるデータの情報量を保ったまま、データ量を圧縮することを指します。データ圧縮のアルゴリズムは2種類に分けられ、1つが可逆圧縮、もう1つが非可逆圧縮です。可逆圧縮はデータを完全に再現できる一方、非可逆圧縮は多少のデータの欠損が発生します。
主成分分析(PCA)
主成分分析は、極力元のデータの欠損を抑えながら、ばらつきのある多次元のデータをより少ない次元に圧縮して表現する手法です。クラスター分析のように、データのグルーピングを行います。
5.異常検知
異常検知とは機械の故障やデータの外れ値を検知・推測することを目的に使用されます。
k近傍法
k近傍法はデータ間の距離を利用して分類、異常検知をする手法で、パターン認識によく使われます。
主成分分析
主成分分析は次元領域だけでなく、異常検知のカテゴリでも活用できます。外れ値を完全に消失しない程度に他の軸に代表してもらい、他のデータの値に近似させる方法で外れ値を実質的に無くします。
One-class SVM
サポートベクターマシン(SVM)の手法を応用したアルゴリズムです。識別境界を設定して、通常値と外れ値を識別する外れ値検知のための手法と言えます。
機械学習が用いられている実例
機械学習の仕組みを知っただけでは、AIがどのように導入されているか想像しにくいと思います。そこで、いくつか実際の導入事例を紹介します。
1.チャットボット
チャットボットはカスタマーサポートに代わって、ユーザーからのお問い合わせや注文に対応するシステムです。よくある質問への対応は機械学習が無くても作れますが、複雑な注文に対応するには機械学習が必要です。
2.スパム検知
スパム検知の機械学習は身近なところで活躍しており、メールソフトの迷惑メールフォルダもその1つです。迷惑メールによく使われる単語を機械学習によって学び、受信したメールがスパムメールかどうか判断しています。
3.商品レコメンド
顧客の購入履歴や商品の閲覧情報を参照して、顧客の特徴や商品選択の傾向を機械学習で見つけ出すことができます。
4.ドキュメント化・データ入力
手書きの文書を正確に文字として認識する技術にも機械学習は使われています。郵便はがきの仕分けの機械やタッチスクリーンの文字認識に用いられています。
5.異常検知
工場の製造業の現場にも、製造ラインの異常や不良品を発見するために機械学習が用いられています。さまざまなデータの読み込みを通じて、異常値の発見に役立てています。
6.自動発注
機械学習によって学習した売上や客数のデータをもとに、売上を予測。そしてそれに応じた発注を自動的に行うシステムがコンビニや製造の現場で活用されています。
7.スコアリング
企業の信用度の格付けや、顧客の価値のスコアリングにも機械学習は活躍します。スコアリングに用いられる指標は様々でデータが膨大です。膨大なデータを処理する場面で機械学習の真価が発揮されます。
8.画像・音声認識
画像認識はカメラの顔認証や画像検索に応用されています。また音声認識は、声をテキストデータに変換することができ、録音するだけで議事録がとれるアプリケーションも開発されています。
9.医療診断
病院には身長・体重や血圧など患者のデータが揃っています。そこに、センサーなどの機器が加わることで、リアルタイムの情報収集ができ、そこで得たデータを機械学習で分析すれば、ガンの予測や病名の特定に役立てられます。
10.需要予測
過去の売上や当時の天候などのデータを分析し、無駄のない需要予測ができます。過不足を減らせるほか、人間が需要予測を行う手間やコストも削減できます。
11.OCR
文書のスキャンで文字をデジタルデータ化するOCRはすでに使われている方も多いでしょう。OCRに機械学習の取り入れると、手書きの文字に対応するなど、読み取りの精度が非常に高まります。
12.調査・分析
機械学習の技術は行政の現場でも活用されています。従来、世論調査は電話や対面でのヒアリングが中心でした。しかし最近ではSNS上のデータを分析することも可能で、選挙結果の効果予測などに使われます。
機械学習を導入したいのであればTRYETINGの「UMWELT」がおすすめ
機械学習の手法やアルゴリズムを見て「難しそう…」と思った方もいるのではないでしょうか。高度なプログラミング知識やAIの知識が無くても社内にAIを導入できるサービスがTRYETINGの「UMWELT」です。社内にITエンジニアがいなくても、直感的な操作感でシステムをAI化。AI導入のための教育コストも最小限に抑えられます。UMWELTは、AI専用のサーバーなどの設備投資も必要なく、既存システムのままAI化できます。これまで人の手で行っていた作業もUMWELTの導入で自動化・大幅な人件費削減が可能です。
まとめ
AI技術は私たちの身近なところで導入されています。本記事を通して「この業務も自動化できるのではないか」と発見いただけたら幸いです。AIによる業務の自動化を導入する際は、手軽に導入できるUMWELTを検討してみてはいかがでしょうか。

TRYETING
公式
TRYETING公式です。
お知らせやIR情報などを発信します。