BUSINESS

データマイニングにExcelを活用する方法|関数や有用なアドインを紹介

 

ビッグデータの活用が盛んに叫ばれ、データマイニングに興味を持っている企業の方は多いと思います。実は、身近なツールであるExcelでもある程度のデータマイニングは可能です。今回はExcelの活用方法について解説していきます。

▼更にデータマイニングについて詳しく知るには?
データ分析とは?分析手法や実施するメリットとおすすめのツールを紹介

▼社内のデータをAI化するには?
ノーコードAIツールUMWELT紹介ページ(活用事例あり)

Excelでもデータマイニングできる?


データマイニングに関するさまざまなツールがリリースされていますが、工夫次第ではExcelでもデータマイニングは可能です。特に、構造化されていないテキストデータから新しい情報を抽出するテキストマイニングで活用しやすく、ビジネスに有益な情報が得られると期待されています。

カスタマーインサイトの発見

マーケティングにおいて顧客ニーズを掴むことは重要です。商品購入の背景や顧客自身も気がついていない潜在的な心理である「カスタマーインサイト」を獲得することで、顧客を惹きつける商品の開発、効果的な宣伝が可能になります。その分析方法としてテキストマイニングが用いられることがあります。アンケートの自由記述・コールセンターへの問い合わせ内容・TwitterなどSNSでのクチコミなどの文章から単語や文節を抽出し、キーワードの出現頻度やそれらの関係性、時系列などの有益な情報を得ることができます。

ビジネスノウハウの蓄積

社内には毎日の営業日報や作業報告書など、多くのテキストデータが存在します。テキストマイニングにより、このようなデータから組織に有益な知識や事例、付加価値のある経験を取り出すことができます。情報が共有されずに属人化していたノウハウが可視化され、社内で共有できます。

ビッグデータの分析・活用

身近で入手可能なテキストデータとしてSNSやインターネット上の掲示板、ブログなどがあります。これらはまさにビッグデータで、テキストマイニングを活用することで企業は自社製品の満足度や評判、売れ行きの予測、仕入れ数などを探ることができます。さらに、不規則に変動する株価や選挙結果を予測する取り組みもあります。

Excelでテキストマイニングを行う方法


それでは、どのようにしてExcelでテキストマイニングを行うのでしょうか。具体的に説明していきます。

1.テキストを分解する

Excelの場合、文章をそのまま分析できないため、分析対象となる文章を単語ごとに分解していく必要があります。このときに使われる技術が「形態素解析」です。

2.ワードを集計する

形態素解析によって生成した単語は「COUNTIF関数」を使い、その登場頻度を集計します。ただし、単語数やデータ量が多いなど条件が複雑な場合はExcelの関数ではうまく集計できないことがあるので、Excelと連動して利用できるソフトウェアを活用し、効率的でスムーズな集計を行いましょう。

3.ワード同士の相関関係を調べて結果を分析する

集計後、分析結果を視覚化するワードクラウドの作成を行います。ワードクラウドとは、対象となる単語の出現頻度を文字の大きさや色に反映させた図表です。Excelで作る場合、単語の集計をする際と同じく、フリーのソフトかアドインを利用します。

Excelをテキストマイニングに使用する上で覚えておきたい関数

テキストマイニングで使用する主な関数は次の3つです。

  • COUNTIF関数
  • INDEX関数>
  • SUM関数

COUNTIF関数/COUNTIFS関数

テキストマイニングを実施する際に単語の集計に用いられるものがCOUNTIF関数です。キーワードなどの条件を設定し、データに一致するセルがいくつあるのかを求めることができます。

INDEX関数

Excelでよく使われるINDEX関数は、指定した位置のセルの値を表示する関数です。単独で使用することは少なく、テキストマイニングでは後述するSUM関数とあわせて使われます。SUM関数と一緒に使用する場合、指定したセルからINDEX関数で指定した範囲までの合計値を求めることができます。

SUM関数

SUM関数とは、指定した範囲の数値を合計する関数です。テキストマイニングでは、特定の範囲内の単語数を集計するときに使用します。SUM関数を実施する際には、COUNTIF関数と合わせて使うことが多いです。

Excelでのテキストマイニングに有用なアドイン


Excel でもテキストマイニングはできますが、Excel自体には簡易的な分析機能しかありません。ここからは、テキストマイニングを行う場合に有用なアドインを紹介します。

SQL Server Analysis Services(SSAS)

「SQL Server Analysis Services(SSAS)」はマイクロソフト社のSQL Serverの標準機能として提供されている分析専用のサービスです。本格的なデータマイニング分析を行う場合には、高度なデータマイニング分析機能を提供しているSSASを利用しましょう。

KH Coder

テキストデータを統計的に分析するためのフリーソフトウェア「KH Coder」は、テキストデータから単語を自動的に取り出し、その結果を集計、解析することが可能です。また、分析者が作成したコーディングルールに基づき、分析を深めることもできます。

E2D3

オープンソースのデータ可視化アプリケーション「E2D3」なら、Excelのスプレッドシート上のデータをグラフや図などを用いて、わかりやすく表現できます。

※E2D3は現在サービスを終了しています。

より効率的にテキストマイニングしたいなら専用ツールを導入しよう!


Excelを使えば費用をかけずにテキストマイニングが可能ですが、精度を求めるのであれば専用ツールの導入がおすすめです。現在では無料で利用できるものを含めて、多種多様なツールがリリースされています。そのため、操作性や分析精度を考慮し、導入の目的に合ったものを選ぶ必要があります。

データマイニングツールの構築はTRYETINGの「UMWELT」におまかせ

ノーコードAIサービスであるTRYETINGの「UMWELT」なら、たったの3ステップでデータ収集から解析・実装までの流れを「ノーコード」で実現可能です。普段使い慣れているExcelとの親和性も高く、導入サポート後に簡単に使えます。

ニーズにマッチしたデータマイニングシステムを構築できる

簡単かつスピーディにAI環境を導入

ノーコードの強みは、コストを小さく設定しながら手早く導入できることです。多様な機能をあらかじめ備えている「UMWELT」は、「知能業務の自動化AI」を高速で安価に実現します。

データマイニングの結果を活用できる

「UMWELT」は、さまざまな分野で効果をあげているアルゴリズムを搭載しています。広告施策の最適化や来客予測を基にしたシフト作成、需要予測、在庫量の最適化など、ビジネスにおいて活用できるシーンは多くあります。

まとめ

Excelでデータマイニングを行うことは可能ですが、効果を上げたいのであれば、専用のツールの導入がおすすめです。「UMWELT」でより良いデータマイニング環境を構築して、ぜひビジネスを効率化してみてください。

WRITING BY

TRYETING

公式

TRYETING公式アカウントです。
お知らせやIR情報などを発信します。