曖昧な基準で顧客や商品などを、グループ分けしたいときに役立つのが「クラスター分析」です。分析にはさまざまな手法や方法があるため、目的に応じて適切に使い分けることが重要です。
本記事では、クラスター分析の概要から手法、実施手順までをわかりやすく解説します。
クラスター分析とは
「クラスター分析」とは、特定の集団のなかから、互いに似た傾向をグループに分ける分析手法のことです。マーケティングにおいては、以下のようなものを対象に分析します。
- 企業
- 顧客
- 商品
- アンケートの回答者
- 人やモノの性質
- 質問項目
性別や年齢、地域など、明確な基準で分類するやり方とは違い、「価格重視層」「トレンドに敏感な人」など、曖昧な基準で分類するのが特徴です。特定のクラスターをターゲットにして新製品の開発や、One to Oneのマーケティング活動を展開したりできます。
クラスター分析を活用することで、新たな分類やグループの発見が期待できます。
クラスター分析の役割
クラスター分析は、統計手法である「多変量解析」における一つの分析手法です。多変量解析とは、複数のデータから、項目間の関係性を分析する手法の総称を指します。
代表的な手法には、以下が挙げられます。
名称 |
概要 |
クラスター分析 |
似ているデータをクラスターとしてグループ分けする分析手法 |
因子分析 |
複数の結果から、共通の要因を見つけ出す分析手法 |
主成分分析 |
複数のデータを、より少数の次元に要約して表す分析手法 |
重回帰分析 |
結果が発生した複数の要因のうち、どれがどの程度影響しているのかを分析する手法 |
コレスポンデンス分析 |
クロス集計表を散布図で視覚的に表す分析手法 |
コンジョイント分析 |
商品の各要素を全体的に評価してもらい、購買の影響度合いを調べる分析手法 |
多次元尺度構成法 |
類似データを2次元で配置し、それぞれの関係性を調べる分析手法 |
多変量解析は、数値から未来に起こりうることを「予測」する、現在ある数値を「要約」する2つの目的があります。クラスター分析の目的は、後者の「要約」にあたります。
クラスター分析の種類
クラスター分析は、大まかに分けて「階層クラスター分析」と「非階層クラスター分析」の2種類があります。以下で、それぞれを詳しく解説します。
階層クラスター分析
階層クラスター分析とは、集団をデンドログラム(樹形図)と呼ばれる階層形式で分類する手法です。デンドログラムはトーナメント表のような図で表し、それぞれの線の近さで類似度合いが決まります。
階層クラスター分析は、図を一目見るだけで関連性を直感的に把握できるのがメリットです。一方、組み合わせの数だけ計算を行わなければならないため、データ量が多いと分析作業が煩雑になってしまいます。
階層クラスター分析の具体例
階層クラスター分析の具体例として、好みの料理を例に挙げて紹介します。たとえば、以下の料理名の好き嫌いを5段階で評価してもらうテストを複数人へ実施したとします。
- カレー
- カツ丼
- 牛丼
- ハンバーグ
- スパゲティ
- 寿司
- ピザ
- オムライス
続いて、回答者(サンプル)と料理名を軸としたクロス表を作成して集計します。最後に、ユーグリッド距離をはじめとした距離の測定方法を定義し、公式を用いてサンプルまたは料理名同士の距離を算出することでデンドログラムを表示する流れです。
非階層クラスター分析
非階層クラスター分析とは、似通った性質を持つ対象を自動でグループ分けする手法です。異なるグループ間での違いを際立たせるように分類を行います。
非階層クラスター分析は、データ量が多くても簡単に分析できるのがメリットです。一方で、分析前に任意でクラスター数を設定する必要があるため、やり方によってはうまく分類されない点に注意が必要です。
非階層クラスター分析の具体例
非階層クラスター分析のなかでも一般的な、「k-means法」と呼ばれる分析手法を用いた具体例で紹介します。ここでは、生徒の体型を分類する例で考えてみましょう。最初に、300人の生徒の身長と体脂肪率のデータを収集します。
次に、縦軸に体重、横軸に身長の2つの変数を設定し、任意のクラスター数とサンプルの核を決めます。その後、核と全てのサンプルの距離を求め、近いものを1つのクラスターとみなします。
続いて、クラスター内の重心点を核として再設定し、再び全サンプルとの距離を測ります。同じ作業を繰り返して、結果が変わらなくなったところで計算が完了です。各クラスター内の特徴を分析すると、「低身長・肥満型」「高身長・筋肉質型」のように分類できます。
クラスター分析の実施手順・方法
クラスター分析を実施するには、どのような手順を踏んで行えばいいのでしょうか。以下では、4つのステップで紹介します。
1.分析目的と対象の決定
最初に、クラスター分析を実施する目的と対象を明確にします。はじめに、以下のような実施目的を設定しましょう。
- 顧客の特性別にマーケティング活動を展開したい
- 各店舗の商圏を分析して、店舗の品揃えを最適化したい
- アンケート結果を分析して、顧客の好みの傾向を把握したい
- 似た商品群を見つけ出し、クロスセルを狙いたい
分析の目的によっては、主成分分析や判別分析といった、ほかの手法が適している場合もあります。本当にクラスター分析を採用すべきなのかをよく検討しましょう。目的が決まったら、次に何のデータをグルーピングするのかを決めます。
具体的には、回答者や店舗、会員など、収集したサンプルを対象にデータのグループ分けをするする「サンプルクラスター分析」、任意の変数を設けて分類する「変数クラスター分析」の2種類があります。
2.分析手法の決定
次に、分析をするデータの数に応じて、階層クラスター分析・非階層クラスター分析の2種類からどちらを採用するかを選択します。
階層クラスター分析の場合、データの組み合わせ数だけ計算を行う必要があるため、多いと計算が複雑になりがちです。一般的には、100以下などの少ない数であれば階層クラスター分析、それ以上の場合は非階層クラスター分析を選ぶことが一般的に推奨されます。
3.対象間の距離測定方法の決定
続いて、データ同士が何の基準で近い・似ていると考えられるかを定義します。具体的には、以下のような距離測定方法が存在します。
- ユークリッド距離
- マハラノビス距離
- マンハッタン距離
- チェビシェフ距離
- ミンコフスキー距離
最も多く使われるのは「ユークリッド距離」で、2点間の直線距離を求めて算出するシンプルな方法です。
4.クラスター分析をするための方法を選択する
最後に、各項目間をどのようにして併合するのかを決定します。階層クラスター分析であれば、デンドログラムの結合方法、非階層クラスター分析であれば、クラスター間の分類方法を決定します。
具体的には、以下のような手法があります。最もよく使われるのは、階層クラスター分析ではウォード法、非階層クラスター分析ではk-means法(k平均法)です。
【階層クラスター分析】
- ウォード法
- 最短距離法
- 最長距離法
- 重心法
- 群平均法
- 可変法
- メディアン法 など
【非階層クラスター分析】
- k-means法(k平均法)
- 最適化法
- 超体積法 など
クラスター分析の活用事例
クラスター分析は、効果的なマーケティング活動を展開するために、実際の現場でよく用いられます。以下では、代表的なものを紹介します。
アンケートデータの分析
ネットリサーチや会場調査などのアンケート調査を実施し、クラスター分析で特徴や傾向を把握するケースがよくあります。新製品のターゲティングに活かしたり、生活者の特徴を端的に表現したりするのが一般的です。
たとえば、「スマホの選定基準」と題したネットリサーチです。「高性能」「価格重視」などの質問項目を設け、それぞれを5段階で評価してもらいます。回答者をクラスター分析し、特定のクラスターをターゲットに開発を行います。
メルマガの配信対象のグルーピング
自社が既存顧客へメルマガを配信する際、顧客の特性に合わせて個別の内容で配信する時、クラスター分析を実施することがあります。
具体的には、会員の購買データを用い、エクセルのアドイン機能や有料の統計ソフトなどでクラスター分析をします。各クラスターを見てみると、「雑貨好きの層」「子育て母親層」「日用品購入層」のように分類できるので、それぞれに合わせたメルマガを配信することが可能です。
クラスター分析の注意点
クラスター分析は、クラスターの数や分類基準、名前などを分析者が決めるため、主観的な解釈がされてしまったり分類がうまくいかなかったりする可能性があります。
たとえば、2点間の直線距離を求めて算出する「ユークリッド距離」ではなく、1点のサンプルと他もう1点の関係性を明らかにする「マハラノビス距離」を選ぶことで同じ2点間でも分析結果が違ってくることがあります。
また、デンドログラムのどの高さで分類するか、非階層のクラスター数をいくつにするかなどは、分析者の意向によっていくらでも変えることができます。
そのため、クラスター分析では客観的なデータは得られない点に注意しましょう。あくまでも、新しいアイデアやヒントを得るために実施するものとして心得てください。
クラスター分析を活用してデータの傾向を整理しよう
クラスター分析を実施することで、数あるデータを大まかな特徴ごとにグルーピングできます。特定のクラスターをターゲットにしてマーケティング活動を展開すれば、より顧客のニーズにマッチした商品・サービスの提供が可能になります。
ただし、採用する分析手法や方法によって結果が大きく変わる点に注意しましょう。分析のやり方が分からない方や不安な方へは、専門家へ依頼することをおすすめします。
SEデザインは、約40年にわたりコンテンツマーケティングの支援をしてまいりました。とくにIT関連業界の実績が豊富で、IT業界における導入事例の制作数はトップレベルであると自負しております。そのほか、オウンドメディア構築、LP制作、ホワイトペーパー・eBook制作、SEO記事制作などの制作や、広告運用などもご支援可能です。コンテンツマーケティングにお悩みがございましたら、ぜひお気軽にご連絡ください。