マーケティングコラム
多変量解析とは?わかりやすく目的や手順・データ分析手法を解説
公開日:
コンテンツディレクター
WEBライティング~メディアの制作ディレクション業務・SNS運用・YouTubech運営/広告運用などで活動しているWEB系フリーランス。
SEO,YouTube,Twitter,Instagram,TikTokの集客媒体全般で集客・コンテンツ制作経験あり。読者・視聴者の潜在ニーズを拾い上げ「見たくなるコンテンツ制作」を意識しています。運営したYouTube漫画 chでは売上20倍に貢献。記事制作に携わったメディアは30サイト以上。現在は、SEOのコンテンツ制作をメインの業務としています。
武田 竜輔
多変量解析とは
そもそも「多変量解析」とは、分析者や企画者の仮説に基づいて、多くの情報(変数)の関連性を明らかにする統計的手法です。簡単にいうと「様々な要因が絡み合ったある事象を分かりやすく説明すること」になります。例えば、クルマの評価に「車両価格」「エンジン性能」「燃費の良さ」「デザイン性」「安全技術」などいくつかの指標を用いるのはご存じでしょう。しかし“それぞれの指標がどの程度重要なのか”はすぐには分かりません。こうした複数の指標が存在する場合において、それぞれの関係性を明らかにすることが、多変量解析を用いる目的になります。
多変量解析を用いると、複数のデータの関連性が見えるようになり、データの活用がしやすくなります。
多変量解析の目的
多変量解析の目的には「予測」と「要約」の2つがあります。さまざまなデータをまとめて分析することで、先々の予測を立てたり、複数のデータをまとめたりするのが多変量解析の目的なのです。以下の項目では、多変量解析の目的について、詳しく解説します。データから「予測」する
多変量解析の目的のひとつに「予測」があります。小売店であれば「曜日・時間帯ごとの顧客数」「商品の売れ行き」「店員数」「在庫数」「立地」「天候」などのデータを多変量解析して、今後の顧客動向や売れ行きを予測できるでしょう。このように多変量解析は、先々の予測をすることを目的として行うことがあります。また、今ある店舗だけでなく、新店舗や新規サービスについての予測にも多変量解析は役立ちます。どこにどのような店舗を作り、どんなサービスを展開すれば顧客が来てくれるのかが、過去の傾向を用いて予測できるのです。
データから「要約」する
複数のデータを「要約」するのも、多変量解析を行う目的の1つです。多変量解析で扱うさまざまなデータは、一見なんの関連性もないように感じる場合があります。しかし、多変量解析を行うとデータ間の関連性が明確になり、データを深く理解するのに役立つのです。例えば、「理科」「数学」の成績データを用いれば、その人の理系能力が分かるでしょう。このように、いくつかのデータを要約して理解しやすくするのが、多変量解析を用いた要約の効果です。
多変量解析でできること
多変量解析を使ってデータの解析を行うと、以下のようなことが実現できます。【多変量解析でできること】
●「来店データ」や「過去の天気データ」などを用いて、曜日や時間帯ごとの売上を予測する
●「使い心地」「価格への納得感」「選んだ理由」などの消費者アンケート結果を用いて、商品の改善ポイントを洗い出す
●「広告宣伝費の配分」「宣伝方法」「宣伝場所」「時間帯や曜日ごとの反応」などのデータを用いて、効果的な宣伝方法を考える
●「年齢」「性別」「既往歴」「血圧」「身長・体重」などのデータを用いて、どんな人がどんな病気にかかりやすいかを把握する
●「曲の長さ」「速さ」「キー(調性)」「メロディーの音域」などのデータを用いて、売れる曲の特徴を考える
上記のように、さまざまなデータを活用して特定の事柄に関する情報を導き出すのが、多変量解析で実現できることと言えるでしょう。
多変量解析で取り扱う2種類のデータ
多変量解析で取り扱うデータには「量的データ」と「質的データ」の2種類があります。それぞれ特性が異なり、多変量解析で予測をしたい際には「量的データ」を用いる必要がありますので、注意しましょう。「量的データ」と「質的データ」の詳しい内容は、以下で解説します。量的データ
質的データとは、数値で表せるデータのことです。「人数」「血圧」「売上」「価格」などが質的データに該当します。多変量解析で何らかの予測をしたい場合、用いるのは量的データに絞る必要があるでしょう。数値で示せる具体的なデータのため、より正確な予測を立てられるためです。なお、量的データにも2種類に分けられます。●間隔尺度
●比例尺度
「間隔尺度」は数値の間隔に意味があるもので、気温や西暦などが該当します。平均値や中央値、標準偏差などを出すのに用いるものです。「比例尺度」は基準点や絶対零点が存在し、数値の比に意味があるもので、金額や身長などが該当します。
質的データ
質的データとは、数値で表せないデータです。「好き嫌い」「性別」などが質的データに該当します。質的データは、多変量解析で要約をしたい際に用いるのが一般的です。なお、量的データは以下の2つに分けられます。●名義尺度
●順序尺度
名義尺度は、データを分類するためのものです。住所や性別、職業などが名義尺度に当たります。順序尺度は、順序や大小には意味があるものの、数字の間隔が均等とは限らないものです。順位や等級などが順序尺度にあたります。
多変量解析を行う手順・流れ
多変量解析の特徴や目的が理解できたら実際に解析を行ってみましょう。複数のデータを扱うため難しいと感じるかもしれませんが、そこまで複雑な解析ではありません。また、さまざまな答えを導き出せるので、解析する楽しさを感じる方も多いかと思います。データを収集する
まずは、解析に使用するデータを集めましょう。データ収集をする際は「データ収集の目的」と「活用方法」を決めてから、収集作業に取りかかってください。目的や用途がはっきりしていないと、何のデータを集めるべきかが不明確になったり、実際に集めたデータから知りたい情報が得られなかったりする可能性があります。また、収集したデータは「データクリーニング」を行いましょう。データクリーニングとは、不適切な回答や重複回答、誤回答などを排除・修正する作業です。データクリーニングを行うと、より正確なデータを用いて多変量解析ができます。
1. 変量解析(単変量解析)を行う
データが収集できたら、それぞれのデータ(変量)を解析しましょう。各データを解析することを「単変量解析」といい、具体的には以下の作業を行います。●外れ値・異常値の検出と処理
●分布状況の確認
「外れ値」とは、ほかの値から大きく外れた値です。箱ひげ図やクラスター分布などを用いて検出しますが、外れ値に見える正常値の場合も多くあるため慎重に扱いましょう。そして、外れ値の中で明らかに正常でないと考えられる数値は「異常値」として、削除や修正を行います。
2. 変量解析(2変量解析)を行う
それぞれのデータ(変量)の解析が完了したら、各データ同士の相関性を調べるために「変量解析」を行います。変量解析には、クロス集計表や散布図など、データの相関性が可視化されるものを用いると良いでしょう。通常の変量解析では、2つの変量を用いる「2変量解析」を行います。クロス集計表や散布図で変量解析を行うと、明らかに平均的な範囲から外れた「外れ値」があるかもしません。外れ値があった場合は、内容を精査したうえで、明らかに異常な値であれば「異常値」として削除・修正を行ってください。
3. 多変量解析を行う
変量解析まで完了したら、いよいよ多変量解析です。多変量解析は、専用のソフトを使って行うのが一般的です。多変量解析ソフトには「JMP(ジャンプ)」や「SPSS」「SAS(サス)」などさまざまなものがあります。Excelをはじめとした表計算ソフトでも多変量解析を行えますが、作業がかなり煩雑になるため、専用ソフトを使用するのがおすすめです。多変量解析を行う際は、目的に合わせた解析が必要である点に留意しましょう。多変量解析にはさまざまな手法があり、目的に合わせて選択する必要があります。データ分析の手法については、次項で詳しく触れますので、参考にしてください。
多変量解析で使われるデータ分析手法の種類
多変量解析で使われるデータ分析手法には、多変量解析を行う目的によって以下の種類があります。■多変量解析の目的:要約
データ分析手法の名称 | 概要 |
---|---|
主成分分析 | 大量の量的説明変数がある場合に、変数をいくつかの主成分(カテゴリ)に分類して整理する手法。 |
因子分析 | 大量の変数があった場合に、その変数となった背景を解析するために用いる手法。 |
多次元尺度構成法 | プロダクトマップなどを用いて、類似しているデータをそれぞれ近い位置にまとめて、 視覚的にわかりやすくする手法。 |
コレスポンスデンス分析 | クロス表の結果を、グラフ化して視覚的に見やすくする手法。 |
クラスター分析 | 異なるものが混在している集団から、類似したものをまとめて、分類する手法。 |
潜在クラス分析 | 量的データと質的データが混在している中から、類似したデータをグループ化する手法。 複数のグループに属するような、あいまいなものも認めるのが特徴。 |
多変量解析の目的:予測
データ分析手法の名称 | 概要 |
---|---|
判別分析 | データが複数のグループに分かれていた場合に、分かれている基準を解析する手法 |
重回帰分析 | 多変数の中からひとつを目的変数に設定し、その他の変数が目的変数にどのような影響を与えるかを解析する手法。 |
コンジョイント分析 | 消費者が商品やサービスを選ぶときに、どの評価項目をどのくらい重視しているかを解析する手法。 |
ロジスティック回帰分析 | 複数の説明変数から、2択の結果(合格・不合格や当選・落選のようなもの、目的変数)が 得られる確率を分析する手法。 |
決定木分析 | 樹形図(ツリー)を用いてデータを分析する方法。 樹形図は、Yes・No選択チャートのようなもの。 |
■多変量解析の目的:因果関係の把握・その他
データ分析手法の名称 | 概要 |
---|---|
選好回帰分析 | 消費者が製品やサービスに対してどのような感情を抱き、どのように比較・選択しているかを構造化する手法。 |
数量化Ⅰ・Ⅱ・Ⅲ類 | 数量化Ⅰ類は重回帰分析、Ⅱ類は判別分析、Ⅲ類は主成分分析もしくは因子分析を指す。 各分析手法は説明変数に「量的データ」を用いるものだが、数量化Ⅰ・Ⅱ・Ⅲ類は質的データを扱えるため、 説明変数を適切に扱えるようになる。 |
上記のように、多変量解析の手法にはさまざまなものがあります。解析の目的に合わせて、最適な手法を選べるように、上記表の内容をある程度覚えておきましょう。
多変量解析を実施する際の注意点
それでは、多変量解析を行えば、あらゆるマーケティング課題・リサーチ課題が明らかになるのかというと、実際はそうではありません。注意しなければならないことはたくさんありますが、今回は注意すべき点を3つに絞ってご紹介します。1. 分析作業が目的になっていないか?
2. その結果は使えるものかどうか?
3. データは丸めてしまっていいものなのか?
分析作業が目的となっていないか
リサーチの仕事をしていると、ついついその先にあるマーケティングアクションではなく、目の前のリサーチ課題を解決することに気が向いてしまうことが多々あります。つい先日、あるファッションブランドのリサーチで「重回帰分析(※1)を用いて、認知度がどう影響して、ブランドイメージから構成されているかを見たい!」というオーダーを受けました。一見、「認知度」を“外的基準”、「ブランドイメージ」を“内的基準”として分析をすれば、課題に対しての答えが出そうですが、これは正しいでしょうか? 答えは“No”です。
なぜなら、ブランドのイメージは認知後に醸成されるものであり、ブランドのイメージが認知度に影響を与えることは理論上あり得ないからです。これは非常に単純な例ですが、このように分析作業を目的としてしまうと、よく考えればありえない構造の分析にも気がつかないことがあります。そうならないためにも、マーケティングリサーチに携わる人間は、必ずマーケティング課題に沿った分析を考えなければなりません。
(※1)重回帰分析・・・多変量解析のひとつ。一つの目的変数と複数の説明変数で説明・予測できると仮定して行う分析手法。売上予測などに使われる。
その結果は使えるものになっているか
多変量解析を行う際に、しっかりとした仮説を持たずに調査・分析をすると、結局使えない結果を導きだしてしまうことが多々あります。たとえば、クラスター分析(※2)を用いて、一般生活者を5つのクラスターに分類してターゲット検討をするとします。しかし、一体どのクラスターがターゲットなのか?また、そのクラスターはどこにいるのか?が分からないままに調査が終わってしまうことがよく見られます。リサーチ担当者・企画者に十分な仮説がなかった場合や、マーケティング担当者が自分たちの顧客像をイメージできていなかった場合は、このような結果になってしまいがちです。また、「クラスター分析をすれば、何かターゲットが出てきそうだ!」と多変量解析に過度な期待をしてしまったときにも、同様のことは発生します。
実際には、後者のような過度の期待が理由で多変量解析の結果がうまく使えないということが発生しているのが大半のようです。安易に多変量解析を行い、それでなんでも解決してくれるかのような認識は改めなければなりません。
(※2)クラスター分析・・・多変量解析のひとつ。回答傾向の似たサンプルを集めて、いくつかのグループ(クラスター)に分類する分析手法。
クロス分析で丁寧に調査したか
多変量解析は、文字通り多くの変数(変量)を使って、ある事象を説明・解明しようとする方法です。この時に、アンケートで聴取した大量のデータを集約したり、一部データを排除したりすることがあります。アンケートで聴取したローデータを原石とすると、多変量解析は、その表面の粗さを研磨する作業に似ています。つまり、ローデータ(聴取されたすべてのデータ)を100%反映した結果にはならないのです。時として非常に重要な質問も集約された情報の一部となってしまい、「この質問はピンポイントで分析したいのに」ということが起こり得ます。そういった細かな違いや特徴を分析するには、多変量解析でキレイに研磨されたデータを見るだけでは足りません。ローデータのクロス分析(集計表)を見ることで、表面のギザギザを丁寧に分析してあげる必要があります。
以上のように、多変量解析は決して万能なものではなく、ケースバイケースで正しく使用する必要があります。マーケティングリサーチに携わる人間は、豊かなマーケティングセンスと正しい統計知識を磨くことが必要不可欠であり、そういったノウハウを持つことが我々マーケティングリサーチ会社の価値であると思っています。