マーケティングリサーチ用語

クラスター分析とは

 

クラスター分析とは

多くの情報の中から仮説を元に、情報の関連性を明らかにする「多変量解析」の手法の一つです。クラスターは英語で「集団」「群れ」のことで、似ているものが多く集まっている様子を指す言葉です。「クラスター分析」は異なる性質のものが混ざり合っている集合体の中から、互いに類似した性質のものを集めて集団(クラスター)を作り、対象を分類する分析手法です。

マーケティングのターゲット戦略を考えるときに、生活者の意識や行動の特性により、グルーピングを行うときに用いられます。対象は人だけでなく、商品や企業、地域、イメージなどを分類する場合もあります。

分類の形式として、階層的方法と非階層的方法の2つに大きく分かれます。

階層クラスター分析

もっとも似ている対象の組み合わせを順々にクラスター化していく手法で、途中の過程が階層のようになり、最終的に樹形図(デンドログラム)が完成します。類似性が近いものから徐々にグルーピングしていくため、最初にクラスターの数を決める必要はなく、後から決めることができます。クラスターの最小数は要素全体をひとまとめにしたときの1で、最大数は対象要素の数となります。

非階層クラスター分析

階層的な構造がなく、最初にクラスター化する数を決め、決めた数のグループにサンプルを分けていく手法です。似たようなパターンのデータを持つ対象を、自動でグルーピングするアルゴリズムのことを言います。サンプルの数が多いデータを分析する際に適しています。

クラスター分析の特徴

最適なクラスター数の正解はなく、非階層クラスター分析では最初にクラスター化する数の設定をどうするかによって結果が異なる点もあります。ただ、標準化された手続きに従い、対象のデータを分類できるので、マーケティングリサーチでは市場での位置づけを目的にしたブランドの分類、イメージワードの分類、消費者のライフスタイルの分類などに用いられ、生活者サイドの視点で分類を行うことが可能です。また、新しく分類したグループごとのクロス集計から、生活者の意識や行動の特徴を深堀りし、自社のターゲット戦略に役立て、効果的なアプローチの手法を模索することができます。

多くの変数を少ない変数で説明する要約の分析手法は、他に「主成分分析」「因子分析」があります。「主成分分析」は多くの変数データを統合し、新たな指標を作り出す方法で、データの解釈がしやすくなります。例えば、食品の味の指標を甘味、塩味、酸味、辛味、コクとそれぞれ数値化し、さっぱりした美味しさと分析します。対してクラスター分析はデータの統合は行わず、グループ分けをしてグループごとの特徴を見る方法です。 「因子分析」は多くの変数データに潜む、共通因子を探り出すことが可能で、エッセンスを見ます。

クラスター分析の手順

分析を開始する際に決めなくてはならいないのは通常、次の3つです。どのように選択するかが「クラスター分析」のポイントになります。

1 分析の種類

階層的方法か非階層的方法のどちらかを選択します。

2 分類の基準となる対象の類似度や対象間の距離

距離を算出する方法としてユークリッド距離(2点間の直接距離)、マハラノビス距離(テーマ群からの距離)などがあります。

3 階層的方法のクラスター間での距離の測定法

ウォード法、群平均法、最短距離法、最長距離法などがあります。ユークリッド距離を使用して、距離が近いものをグルーピングし、グループ化を繰り返します。最終的には樹木の幹が形作られるような樹形図が出来上がります。その後、複数のグループ分けをして各グループの特徴を見たり、クロス集計を行い、意識や行動の深堀りを行ったりします。

クラスター分析事例

クラスター分析は、アンケート調査の質問項目(カテゴリー)や回答者を回答の類似性から分類しグルーピングする手法です。回答のされ方が類似している質問項目(カテゴリー)をグルーピングする方法を「変数クラスター分析」、回答の仕方が類似している回答者をグルーピングする方法を「サンプルクラスター分析」と呼びます。分析に際しては、回答サンプルごとのアンケートの回答データ(ロウデータ)から質問項目間、回答者間の距離を計算し、距離が近い(短い)ものを集めてグルーピングします。

以下は、ファッションに対する志向を10人の人にアンケートにより回答してもらった回答データです。
【ファッションに対する志向(回答データ)】 【ファッションに対する志向(回答データ)】

このデータから回答者をグルーピングする「サンプルクラスター分析」の手順をみてみましょう。クラスター分析は回答者間の距離を計算し、距離が近い(短い)もの同士を集めてグループ化する分析手法ですので、まずは距離の計算を行います。

距離を算出する方法はいくつかありますが、最も一般的なものが「ユークリッド距離」の測定で、以下のような公式で求められます。

下記のような回答データから「No.①と②の回答者間の距離(d)」の2乗をd²とする。
d²=(x₁-y₁)²+(x₂-y₂)²+(x₃-y₃)²+(x₄-y₄)²+(x₅-y₅)²
ここから、距離d=√d²
【回答データ】 【回答データ】

前掲の回答データを用いて10人の回答者間の距離を計算すると以下のような結果になります。 【回答者間の距離】 【回答者間の距離】

上記のサンプル間の距離からみると一番距離が近いのは「①と②」及び「⑥と⑦」です。まずは、この組み合わせをそれぞれ1つのグループと考えて[①,②]、[⑥,⑦]とします。近いとは言ってもグループ[①,②]及び[⑥,⑦]には、それぞれ2つの点が存在するので、このグループを代表する点(値)を1つ定めます。これを「合併後の距離計算」と言い、最短距離法、最長距離法、群平均法、重心法、ウォード法などいくつかの方法があります。これによって定められた新たなサンプルグループ[①,②]及び[⑥,⑦]の数値により他のサンプルとの距離を再計算し、最も近いサンプル同士のグループ化を繰り返し行っていきます。

クラスター分析では、グループ化された結果を樹形図(デンドログラム)として表します。樹形図は距離の近いサンプル同士を矩形で結んでいきます。再計算を繰り返して合併されていくグループ同士も距離の近いものの順に並べられ矩形で結んでいき、樹の根から幹が形作られるように上方に向かって一つの幹になるまで計算を繰り返していきます。矩形の高さは結ばれたサンプル(グループ)間の距離の近さに比例して示します。前掲のファッション志向によるサンプルクラスター分析の結果は以下のような樹形図となります。

この結果からサンプル全体を3つのグループに分けたいと思えば、3つの交点ができるよう横に分割線を引きます。この分割線の交点より下にあるサンプルが、そのグループに属するサンプルとなります。グループ数については、それぞれのグループの特徴が出るように分析者が決めます。一度3つのグループと見当をつけて各グループの特徴をみた結果により、再度4つに分けて分析を行うなど分析の精度を高めるための試行錯誤が必要になる場合もあります。

クラスター分析によって分けられたグループを「クラスター(グループ)」と呼びます。今回の分析で得られた3つのクラスターの特徴をみるためにクラスターを表側としたクロス集計分析を改めて行い、クラスターに名前をつけます。各クラスターと分析の元となったファッション志向の結果をクロス集計したら下表のようになりました。本来は他の意識や行動に関する質問項目、属性項目等ともクロスして特徴を細かくみて、ネーミングやクラスター分析の精度を確認します。     

【クラスタークロス集計表】 【クラスタークロス集計表】

3つのクラスターをA,B,Cとすると、クラスターAは「モード」で「シック」なファッションに対する志向が強いので「モード・シック派」としました。同様にBは「トラッド派」、Cは「スポカジ派」と名づけました。

変数クラスター分析については、変数間の距離の算出方法がサンプルクラスター分析とは異なり、変数間の相関係数( r )によって求められます。「変数間の距離d=1-r」の公式から、相関係数が大きく(関係性が強い)なればdは小さく(距離が近く)なります。変数間の距離が算出されれば、解析の手順はサンプルクラスター分析と同様です。

    

クラスター分析 応用事例

ある商品のターゲット層を「美容に対する意識」と「ワークライフバランス意識」でクラスター分析を行いました。分析の結果、「“ストイック”に仕事タイプ」「“何でも欲しがる”欲張りタイプ」「プライベート“のびのび充実”タイプ」「無関心“マイペース”タイプ」の4つのクラスターに分けられました。以下のようなポジショニングマップで表すと、各クラスターのボリュームとグルーピングの軸に対する位置関係が一目でみてとれます。


クラスターのボリュームからすると「仕事タイプ」が狙い目のように思われますが、下記のようなクロス集計分析を行うことで、対象商品に対する購入意向が強い「欲張りタイプ」が注目すべきターゲットであることがわかります。また、接触媒体への傾向から媒体Dによるアプローチが有効であることも明らかになりました。

関連コラム

マーケティングコラム
クラスター分析で見えてくるシングルソース活用の幅
マーケティングには様々な手法がありますが、ビッグデータの浸透によりクラスター分析が盛んになりました。この分析にはシングルソースが活用されます。シングルソース・データとは、一人の人を対象とした購買履歴や生活習慣、興味のある広告などの幅広いデータを指します。この記事では分析で見えてくるシングルソース活用の幅を検証していきます。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
女性を対象としたマーケティングはこまめな細分化が鍵
10年ほど前にベストセラーになった、とある本があります。日本国内だけで200万部、世界40か国以上で600万部も売れたというこの本は、男性と女性の考え方と行動の違いについて紹介しています。この本が売れてからというもの、男性と女性の価値観やコミュニケーション方法の違いなどを解説する本が次々に出版されるようになりました。男性と女性が時代も国境も超えて、互いに「違うから理解し合いたい」と感じているということの表れでしょうか。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
変遷する市場のカスタマー像をシングルソースデータベースから発掘!
株式会社クロス・マーケティング リサーチプランニング部 赤津 美也
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
多変量解析とは?わかりやすく目的や手順・データ分析手法を解説
多変量解析と聞いて、どのようなことを思い浮かべるでしょうか。ポジティブなイメージとしては“応用力の高い”“新しい発見がある”、ネガティブなイメージとしては“難しい”“実務に使いにくい”ということなどを思い浮かべるのではないでしょうか。我々リサーチ会社が提供する“多変量解析”は、アンケートデータの分析において非常に便利なツールであり、様々なシーンで活用できるものです。一方で、使い方をちゃんと理解していないと、誤ったマーケティングアクションを招いてしまう可能性があります。そのため、企画者・分析者は多変量解析についての正しい理解と説明力が必要です。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
デジタルマーケティングコラム
世界スマホシェア率を日本と比較|人気のOSやメーカーは?
アプリ開発企業のマーケティング担当者の中には、世界のスマートフォンシェア率が気になっている方もいるでしょう。人気のOSやメーカーなどに関して、世界全体と日本との傾向の違いを把握しておくことで、マーケティングに活かせる面もあるかもしれません。今回は、世界のスマートフォンシェア率に関して、日本と比較しながら解説します。 世界と日本のスマホOSシェア率 スマートフォンのOSはiOSとAndroidが、世界全体で大きなシェアを占めており、ツートップの状態です。日本においても、iOSとAndroidの2つのOSがシェアのほとんどを占めています。 ただ、iPhoneとAndroidのシェア率の割合に関しては、世界全体と日本で大きく異なるのが現状です。では、どのように異なるのか、世界と日本に分けてスマートフォンOSのシェア率を紹介します。 世界のスマホOSシェア率 世界のスマートフォンOSのシェア率は、Androidの方が高いのが特徴で、約7割程度のシェアを占めています。では、世界のスマートフォンOSのシェア率について詳細を解説します。 2024年のシェア率 2024年の世界全体でのスマートフォンOSのシェア率は、iOS(iPhone)が3割程度で、AndroidとiOSの割合は約7:3の比率です。(Android:71.6%、iOS:27.8%)また、iOSとAndroid以外に、一部のメーカーが独自に開発しているその他のOSもありますが、その他のOSのシェア率は非常に低く、0.6%にとどまっています。 2015年~2024年のシェア率 2015年から2024までのスマートフォンOSのシェア率の推移に関しては次のグラフの通りです。 世界全体でのスマホOSは、2019年まではAndroid、iOSともに増加傾向にあったもの、2015年からAndroidよりもiOSのシェア率が低い傾向に変わりはありません。2020年以降ここ5年間はAndroidとiOSの割合は約7:3の比率になっています。 出典:Statcounter Global Stats「Mobile Operating System Market Share Worldwide」 ...
# デジタルマーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
これからの時代はZ世代マーケティングが重要!理由と手法を解説
Z世代は、多様な価値観を受け入れ、新しいトレンドに敏感な消費者層です。これからの消費市場を担う中心的な存在であるため、経営者やマーケティング担当者にとって、Z世代向けの効果的なマーケティング戦略を構築することは、ビジネス成長の鍵となるでしょう。今回は、Z世代マーケティングの基本戦略をはじめ、具体的な手法について紹介します。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
価値観が多様化する時代に企業は何を発信すべきか 大橋久美子氏が語るブランドづくりの新しいアプローチ(後編)
デジタル時代だからこそ、人間らしい価値がこれからのブランドを輝かせる 企業のブランディングにおいて、体験価値の設計や価値観の変化への対応が重要性を増している。しかし、企業の意図とユーザーの実態との間にギャップが生じるケースも少なくない。そうした課題に対し、アーキタイプの活用や段階的なユーザー理解などの、効果的なアプローチが注目されている。デジタル化が進展する中でも、人間的なコミュニケーションの価値はむしろ高まりつつあり、企業には社会課題の解決への積極的な貢献も期待されているという。これからの時代に求められるブランディングの在り方について、引き続き株式会社Stories of Japanの代表、ブランドストラテジスト・大橋久美子氏に話を聞いた。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
価値観が多様化する時代に企業は何を発信すべきか 大橋久美子氏が語るブランドづくりの新しいアプローチ(前編)
機能から感情へ、日本企業に求められるブランド価値の再定義 商品やサービスの認知度を高めることが最優先だった時代から、企業の姿勢や社会的意義が問われる時代へ。ブランドとユーザーの関係性は大きく変化している。特に、SDGsを始めとした社会課題への向き合い方など、企業の本質が問われるようになってきた。一方で、日本企業は優れた製品やサービスを持ちながら、その価値を効果的に伝えきれていないという課題も浮き彫りになっている。こうしたブランディングにおける現状と課題について、博報堂、J. Walter Thompson Japan、LIFULLでの経験を経て、現在は株式会社Stories of Japanの代表を務め、日本企業のブランディングを数多くリードしてきたブランドストラテジスト・大橋久美子氏に話を聞いた。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
リキッド消費とは?企業が得られるメリットやサービス例
消費に対する価値観が多様化するなかで、「リキッド消費」が注目されています。リキッド消費は比較的新しい概念で、モノを持たないことに価値を見出す消費行動です。 リキッド消費はなぜ広がっているのでしょうか。また、企業がモノを売るためにはリキッド消費をどのように活用すれば良いのでしょうか。 今回は、リキッド消費の概要やメリット、事例について紹介します。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
ご相談・お見積もり依頼
【法人・個人様】
フリーダイヤルでのお問い合わせ
0120-198-022
※ モニター様からのお電話でのお問い合わせは受け付けておりません。
資料ダウンロード