MENU CLOSE

CONTACT TRY TRYETING

COLUMN コラム

データマイニング

データマイニングの基礎を簡単解説!言葉の意味から分析のやり方・ポイント

データマイニングは、データの中から経営上有益な法則などを見出して、パターンやルールを発掘する技術です。当記事ではデータマイニングの基礎や分析方法、またそのポイントについてわかりやすく解説します。データマイニングの定義を知りたい方や、マーケティング部門の担当者の方はぜひ参考にしてください。

article-banner-umwelt

データマイニングの基礎知識


データマイニングの基礎知識や活用例、具体的な方法を解説する前に、まずはデータマイニングの意味や果たす役割、機能、種類について説明します。

データマイニングの意味

データマイニングのマイニングには、「発掘する」という意味があり、AIやパターン認識、統計学などを活用して膨大なデータから有益な情報を発掘する(マイニング)ことを指します。Webサイトの構造や、Web上のデータを利用して行うデータマイニングを「Webマイニング」、構造化されてないテキストデータから、新しい情報を抽出する分析手法を「テキストマイニング」と呼びます。

データマイニングは、顧客満足度と顧客ロイヤルティの向上を通して、売上の拡大と収益性の向上を目指す経営戦略、顧客関係管理をサポートする技術です。

データマイニングが果たす機能

膨大なデータのなかから仮説を発見するデータマイニングが果たす機能には、予測・分類・関連性の3つがあります。

1.予測
予測では収集したデータから購入率や受注率、解約率など事象が発生する確率を算出し、発生要因を明確にします。

2.分類
分類では収集した購買データや商品データ、顧客データを特徴に応じて仕分けをします。例えば、購買データから優良顧客の分類や、営業先の膨大な情報をセールスターゲット別に分類できるようになります。

3.関連性
大量に蓄積されたデータから、同時または頻繁に発生する事象を探索し、抽出します。

1992年12月23日、米紙「ウォールストリートジャーナル」に掲載された「紙おむつとビール」での実証がこの関連性に当てはまります。アメリカの大手スーパー、ウォルマートの物品販売量と顧客の購買情報に関するデータを収集・分析した結果、紙おむつを購入する顧客についての驚くべき情報が得られました。

通常、紙おむつを買う人は一緒に乳幼児用品を購入すると予想されていました。しかし、データマイニングした結果、紙おむつとともによく購入されている商品はビールであることがわかったのです。

お母さんに頼まれオムツを買いに来たお父さんが、自分が飲むビールを一緒に買うケースが多いとわかったのです。データマイニングで分析しなければ、ふたつの商品にこのような関連性があることに気付きにくかったといえます。

この後、スーパーマーケットでは紙おむつとビールのコーナーをお互いによく見える位置に配置し、販売量アップにつながったそうです。

データマイニングの種類

データマイニングには、「知識発見」と「仮説検証」の2種類があります。知識発見は、機械学習やディープラーニングで多く利用される手法で、蓄積されたデータから、新しいパターンやルール、知識を自動的に発見する手法です。

仮説検証はある仮説や目的をもとに、検証したい課題の解決に必要なデータを収集し、分析する手法です。機械学習やディープラーニングのほか、従来の統計的手法が使われるケースもあります。知識発見は「探索型データマイニング」、仮説検証は「目的志向型データマイニング」といえます。

データマイニングと統計解析は何が違う?

データマイニングは、データの相関性や法則性を探索します。探索・発掘したものから仮説を立てますが、マイニング中に仮説は行いません。一方、統計解析では仮説を検証するために分析を行います。

データマイニングが活用されている業種


これまでデータマイニングの概要について見てきました。次に、データマイニングが活用されている、製造業を含む6つの業種について紹介していきます。

製造業

製造業においては、製造現場における機器メンテナンス頻度の予測や欠陥の発見、設計、製造、品質保証、スケジューリングに活用しています。予測分析の活用で、故障の発生や不良品を未然に防げるようになり、生産性向上やコスト削減が実現できます。

通信

通信会社では、膨大な顧客データを分析することで、顧客の行動を予測し、ターゲットを絞った的確なキャンペーンの提供が可能です。高品質なサービスを提供するために必要な通信・回線障害の検出と、その原因の推定にデータマイニングの活用が期待されています。

小売業

小売業では、販売実績を天候や曜日、時間帯などと組み合わせて解析することで、商品の仕入れ量を調整できます。また、顧客の属性や趣味、好み、履歴に合わせた特定の顧客へのクーポン提供といったキャンペーン実施にも活用可能です。

保険

保険会社が分析を活用すると、保険の不正行為やリスク管理のほか、顧客維持など複雑な課題解決に結びつけられます。例えば、生命保険解約に伴う要因を分析することが、解約率の低下につながります。自動車保険では、年間走行距離や地域などを分析して、効果的な保険料設定を実現できます。

銀行・金融業

銀行経営や金融業においては、顧客ベースでニーズを把握した適切なタイミングでの商品提供や融資の可否、顧客の属性から推定するローン与信審査などに活用できます。他に、市場リスクの把握や法規制コンプライアンス義務の管理にも役立ちます。

教育

教育現場におけるデータマイニング活用のひとつが、学習者の成績データ分析です。その結果、得意・不得意分野を把握でき、一人ひとりに適切な指導や教育を実現できます。他には学習者の成績や学習成果の予測も可能です。

データマイニングの実行プロセス


データマイニングと一緒に耳にすることの多いデータサイエンスは、統計学、情報科学、アルゴリズムなどを駆使して、データ収集から課題解決までを横断的に扱うことを指します。データマイニングはデータサイエンスの領域内に含まれており、データ収集から課題解決までのうち、データ選択から分析、モデル構築までの工程を指す言葉です。具体的には以下のようなステップを踏んで、実行していきます。

データ選択

効果的なデータマイニングを行うためには、まず目的を把握し、その目的に合致したデータを収集・調査し、質の良いデータを用意します。

データクレンジング

次に収集したデータ内のノイズを加工して整理する「データクレンジング」作業をします。具体的には重複や誤記、表記揺れなどを探し出し、削除や修正、正規化します。

探索的データの解析

特定のアルゴリズムを使用して、該当する種類のモデルを作成します。解析には、ロジスティック回帰分析、クラスター分析、マーケット・バスケット分析、機械学習を用いて行い、パターンを発見します。それぞれの分析手法については後述します。

評価

解析後には検証・評価を行います。万が一、期待通りのモデルになっていない場合は各種パラメータを変更し、最適な値を得るようにしてモデルを再作成します。モデルが業務目標を達成しているか、業務上の問題点がすべて取り込まれているかについての評価も必須です。評価の仕上げとして、データマイニング結果の活用方法を決定します。

データマイニングの分析手法


次に、探索的データの解析に用いられる、データマイニングの4つの分析方法について解説します。

ロジスティック回帰分析

ロジスティック回帰分析は、いくつかの要因から2値(Yes・No、有・無のように2つしかない値)の結果が起こる確率を予測する手法です。マーケティングでよく用いられる手法であり、DMへの反応率のほか、気象観測データを用いた土砂災害発生予測や患者の検査値からの病気発生率の予測などに活用されています。

クラスター分析

クラスター分析とは、データのなかから類似性に基づいてグループ分けをする手法です。主にマーケティングでの現場や市場調査のデータ分析、顧客情報をもとにしたDM配信の効率化などに活用されています。

マーケット・バスケット分析

マーケット・バスケット分析は、来店者が同時に購入しやすい商品の組み合わせを分析する手法です。前述した「紙おむつとビール」のように、マーケット・バスケット分析により意外な法則の発掘につながるほか、効果的な売り場作りに役立ちます。

機械学習

人工知能の一種である機械学習もまた、データマイニングの分析方法のひとつです。なかでも、プログラミング言語のPythonはデータ分析に役立つ便利なライブラリが充実しており、データから法則や関連性を見出す有効な手法です。

データマイニング活用のポイント


ここからは、データマイニング活用の2つのポイントを紹介します。

データの質を保つ

データの質が悪い場合、妥当性の低い結果が出るおそれがあるため、欠損や異常値が少なく、重複のないデータを用いるなど、データの質には注意が必要です。

データマイニングツールを導入する

膨大なデータ分析には、現場の負担も大きくなることが予想されます。特に、自社にデータを分析する専門知識を持ったスタッフがいないケースや、データを有効活用できない、または活用手段がわからないといったケースには、データマイニングツールの導入をおすすめします。データマイニングツールを導入すると、下記のようなメリットがあります。

  • データ収集・分析にかかる時間と労力が軽減できる
  • 専門スタッフが不在でも分析できる
  • 埋もれているビジネス課題を効率的に発見できる

データを有効活用するならTRYETINGのAIツール「UMWELT」にお任せ!

膨大なデータを有効活用するには、TRYETINGのノーコードAIクラウド「UMWELT」がおすすめです。「UMWELT」はさまざまなアルゴリズムをノーコードで構築できるため、データサイエンスやAIに関する専門人材を採用することなくデータ分析から活用まで可能です。従来のAIシステム導入までの期間は業界平均の1/4、さらに導入コストは業界平均の1/10と低コストで運用可能です。

まとめ

データから価値ある情報を発掘するデータマイニングは、マーケティングに活かすために必要不可欠な分析手法です。また、顧客との長期的に良好な関係を築くための戦略をサポートしてくれるものでもあります。膨大なデータの中に埋もれている課題を効率的に見出すためにも、ぜひ弊社のUMWELTをご活用ください。

参照文献

Supercomputers manage holiday stock|Wilke, John R. The Wall Street Journal Western Edition.(1992)

データマイニング分野のクラスタリング手法(1) : クラスタリングを使ってみよう!|神嶌 敏弘、日本知能学会誌(2003)
https://www.jstage.jst.go.jp/article/jjsai/18/1/18_59/_pdf/-char/ja

UMWELTのサービスページをチェックする(下記画像をクリック)

article-banner-umwelt

WRITING BY

TRYETING

公式

TRYETING公式です。
お知らせやIR情報などを発信します。