消費者の行動や価値観の多様化により、これまで以上に顧客理解の重要性が高まりました。テキストマイニングを使えば、アンケートやSNS、ブログなどのテキストデータを分析し、消費者の本音を可視化できます。結果的に、顧客インサイトや施策が上手くいかなかった要因の発見などにつながるのです。
本記事では、テキストマイニングの活用目的や手法、おすすめの無料ツールなどを紹介します。記事を参考に、自社でのテキストマイニングを導入についてするのか検討してみてください。
テキストマイニングとは?
テキストマイニングとは、「自然言語処理」を用いて、大量のテキストデータの中から新しいインサイトや情報を見つけること、もしくは見つけた情報の中から実務に使えるものを探し出すことです。
テキストマイニングはデータマイニングの一種です。データマイニングはすべてのデータが対象となるのに対し、テキストマイニングは文字列が対象となります。
ビジネスの現場で使われるおもなテキストデータは以下の通りです。
- メール
- SNSへの投稿
- 口コミ・評判サイト
- アンケート
- コールセンターの音声をテキスト化したデータ
今日のビジネスにおいて、顧客の声は重要な意味を持ちます。顧客の声を製品開発や施策に反映させれば、企業は成長を遂げられるのです。
アンケートやヒアリング調査を実施する企業は増えていますが、結果をきちんと活用できているでしょうか。テキストマイニングを使えば、膨大な量のテキストデータを瞬時に分析し、効果的に必要な情報を得ることができます。
テキストマイニングの活用目的
ビジネスの現場でテキストマイニングは、以下の5つの目的で活用されます。
- 顧客ニーズの発見
- 施策の成功・失敗要因の解明
- チャットボットの精度向上
- 集計・分析作業の効率化
- 将来予測
ここでは、この5つの活用目的について解説します。
1.顧客ニーズの発見
テキストマイニングの最大のメリットは、数値分析からは見えない深い洞察を得られることです。顧客アンケートや製品レビュー、SNSの投稿などから得た顧客の声を分析することで、数値では表せないインサイトや改善点の発見ができます。結果的に、新製品開発や効果的な施策の推進などのデータ・ドリブンの意思決定が可能になるのです。
2.施策の成功・失敗要因の解明
製品や施策が上手くいっているかどうかは数値を見れば分かります。しかし、施策の成功・失敗要因は数値からは判断できません。成功や失敗の要因は、消費者が「なぜ、どのような感情で意思決定をしたのか」を特定することで判明します。
そして、消費者が意思決定した理由は、顧客の声を分析することで解明できます。テキストマイニングを用いて、アンケート結果やインターネット上にある膨大な顧客の声を解析すれば、要因の発見につながります。
3.チャットボットの精度向上
テキストマイニングは、チャットボットの精度向上にも活用できます。チャットボットは、ユーザーが入力した情報をもとに、適切な回答をデータベースから探し出します。そのため、データベースにない質問には対応できません。
顧客がチャットボットに入力した内容を用いてテキストマイニングを実施すれば、チャットボットが回答できなかった質問が瞬時に分かります。解析結果をもとに、チャットボットのチューニングをすれば、効率よく回答の精度を向上できます。
4.集計・分析作業の効率化
大量のアンケート結果を手作業で集計・分析するには、多くの時間がかかります。また、人的ミスが生じる懸念もあるでしょう。テキストマイニングツールを使えば、大量の業務データを瞬時に分析できるため、集計・分析業務の効率化を実現できます。
分析結果はレポートや表グラフ形式で可視化するため、データ加工の手間も削減できます。
5.将来予測
SNSやブログなどに投稿される膨大なテキストデータを分析すれば、トレンドや将来の売れ行き予測などが可能です。
たとえば、化粧品会社が製品開発につながる示唆を得るため、Twitterで「メイク」をキーワードにテキストマイニングを行った結果、「メンズメイク」という単語の登場回数が多かったとします。海外の有名人がメンズメイクをしている背景もあり、「今後はメンズメイクが流行る」という仮説を立てられるでしょう。
そのほか、SNSや口コミを時系列で分析し、製品需要がある時期の予測立てもできます。
テキストマイニングの流れ
テキストマイニング実施の流れは、おもに以下の通りです。
- 1. データの前処理(自然言語処理)を行う
2. 非構造化データを構造化データに変換する
3. データの分析を行う
それでは、一つずつ詳しく見ていきましょう。
1.データの前処理(自然言語処理)を行う
データを収集したら、分析しやすくするために自然言語処理を行います。その際に使用する2つの解析方法「形態素解析」と「構文解析」について紹介します。
形態素解析
形態素解析とは、テキストを最小単位(=形態素)に分けて、各単語の品詞や変化などを特定する手法です。日本語には曖昧な表現が多いため、高度な処理が必要です。
たとえば、「私はニンジンが嫌いです」という文章を形態素解析すると、下記の通りになります。
- 私(名詞)/は(助詞)/ニンジン(名詞)/が(助詞)/嫌い(名詞)/です(助動詞)
形態素解析は、テキストマイニングや機械翻訳などの基礎技術となっています。
構文解析
構文解析とは、テキストを文法に従って解釈し、文の意味や構造を明らかにする手法です。たとえば、「この料理の見た目は綺麗だが、味は良くない」という文章を構文解析すると、下記の結果となります。
- ・ 見た目 =綺麗(ポジティブ)
・ 味 = 良い(否定)
このように構文解析は、テキスト内に含まれる意見や感情を可視化します。
2.非構造化データを構造化データに変換する
ビッグデータの分析対象となるデータは、以下の2つに大別できます。
- 構造化データ:伝票やレポートなどの数値化されたデータ(分析しやすい)
- 非構造化データ:文章や音声などの数値化できないデータ(分析しにくい)
テキストデータは、数値化されていない「非構造化データ」であるため、そのままでは処理が困難です。非構造化データの中から規則性を見つけ出すことで、構造化データに変換することができます。
3.データの分析を行う
自然言語処理と構造化データへの変換により、テキストマイニングをする準備が整ったら、目的に適した手法で分析を実施します。テキストマイニングの詳しい分析手法は、次の項で解説します。
テキストマイニングの分析手法
テキストマイニングの分析手法はおもに以下の3つです。
- センチメント分析
- 対応分析
- 主成分分析
各分析手法の特徴を的確に理解し、分析の目的とデータに最適な手法を使いこなす必要があります。以下では、3つの分析手法を解説します。
消費者の感情を分析する「センチメント分析」
センチメント分析(感情分析)とは、SNSや口コミ、ブログなどの書き込みに込められた消費者の感情を分析する手法です。テキスト内容を「肯定的(ポジティブ)」・「中立的」・「否定的(ネガティブ)」のいずれかに分類します。
センチメント分析が得意とするのは、消費者の本音の可視化です。消費者の本音を可視化できれば、製品開発や施策の評価・改善、新たな顧客層の特定などを見込めます。
マーケティング結果を散布図で示す「対応分析」
対応分析(コレスポンデンス分析)とは、クロス集計表から各項目の関係性や傾向を散布図として可視化する手法です。分析項目と集計項目が多く、結果の把握が困難なアンケートに用いられます。
ビッグデータを要約する「主成分分析」
主成分分析とは、その名の通り、データの主成分のみを抽出する手法です。ビッグデータなどの項目が多いデータは、分析や解釈が困難なため、この手法が用いられます。具体的には、複数の項目を組み合わせ、指標や変数の数を減らします。
たとえば、自社の清涼飲料について、ポジション把握のためにアンケート調査を行ったとします。
【アンケート調査結果】
ブランド |
飲みごたえ |
甘さ |
香り |
炭酸刺激の強さ |
後味の良さ |
爽快さ |
A社 |
8 |
7 |
5 |
8 |
7 |
8 |
B社 |
8 |
8 |
6 |
9 |
8 |
9 |
C社 |
7 |
8 |
8 |
6 |
6 |
6 |
D社 |
7 |
9 |
8 |
8 |
7 |
7 |
自社 |
8 |
9 |
6 |
7 |
6 |
6 |
上表を見ただけでは、比較項目が多いため、評価や解釈が困難でしょう。そこで主成分分析を用いて、項目数を減らします。主成分分析の結果、以下2つが総合指標となりました。
- 味の総合評価
- 爽快さ
ブランド |
味の総合評価 |
爽快さ |
A社 |
7.2 |
8 |
B社 |
8 |
9 |
C社 |
6.8 |
6 |
D社 |
7.7 |
7 |
自社 |
6.7 |
6 |
6個の比較項目を2個まで減らしたことで、結果の分析や解釈が容易になります。
無料のテキストマイニングツール3選
テキストマイニングを行うには、ツールを使用することが一般的です。
ここでは、無料で使えるテキストマイニングツール3選を紹介します。
1.Excel
Excelで実施できるテキストマイニングは以下の通りです。
- 頻出後の集計と棒グラフ化
- ワードクラウド(出現回数が高い単語を大きさで図示)
シンプルな機能のみですが、アンケートの分析としては有効です。
2.AIテキストマイニング
AIテキストマイニングは、株式会社ユーザーローカルが提供するテキストマイニングツールです。アンケートの自由記述や口コミなどを入力するだけで、テキストマイニングができます。無料版では、以下の機能を利用できます。
- ワードクラウド
- 単語出現頻度
- 共起キーワード
- 2次元マップ
- 係り受け解析
- 階層的クラスタリング
- 感情分析
- 文書要約
簡単操作で、様々なテキストマイニング手法を体験できるため、テキストマイニングのイメージを掴むのに最適なツールです。
3.KH Coder
KH Coderとは、R言語を用いたフリーソフトウェアです。フリーソフトウェアながらも、単語抽出やクラスター分析、対応分析などの豊富な機能がそろっています。KH Coderを用いた計量テキスト分析に関する書籍も出版されているため、入門者でも使いやすいでしょう。
最後に
テキストマイニングをすれば、顧客インサイトの発見や施策の最適化などの様々なメリットを得られ、データ・ドリブンの意思決定が可能になります。
消費者行動や価値観の多様化により、これまで以上に顧客理解の重要性が増しています。この点を踏まえると、SNSやアンケートなどの膨大なテキストデータから顧客の本音を可視化するテキストマイニングは、非常に有効な手法です。
テキストマイニングの結果は、営業やマーケティング、カスタマーサクセスなどのあらゆる部署で活用できるため、導入の検討をしてみてはいかがでしょうか。