マーケティングコラム

多変量解析とは?わかりやすく目的や手順・データ分析手法を解説

Facebook X
20220909_takeda-Dec-12-2024-09-04-43-2577-AM
コンテンツディレクター
WEBライティング~メディアの制作ディレクション業務・SNS運用・YouTubech運営/広告運用などで活動しているWEB系フリーランス。
SEO,YouTube,Twitter,Instagram,TikTokの集客媒体全般で集客・コンテンツ制作経験あり。読者・視聴者の潜在ニーズを拾い上げ「見たくなるコンテンツ制作」を意識しています。運営したYouTube漫画 chでは売上20倍に貢献。記事制作に携わったメディアは30サイト以上。現在は、SEOのコンテンツ制作をメインの業務としています。

武田 竜輔

多変量解析と聞いて、どのようなことを思い浮かべるでしょうか。ポジティブなイメージとしては“応用力の高い”“新しい発見がある”、ネガティブなイメージとしては“難しい”“実務に使いにくい”ということなどを思い浮かべるのではないでしょうか。我々リサーチ会社が提供する“多変量解析”は、アンケートデータの分析において非常に便利なツールであり、様々なシーンで活用できるものです。一方で、使い方をちゃんと理解していないと、誤ったマーケティングアクションを招いてしまう可能性があります。そのため、企画者・分析者は多変量解析についての正しい理解と説明力が必要です。

多変量解析とは

そもそも「多変量解析」とは、分析者や企画者の仮説に基づいて、多くの情報(変数)の関連性を明らかにする統計的手法です。簡単にいうと「様々な要因が絡み合ったある事象を分かりやすく説明すること」になります。

例えば、クルマの評価に「車両価格」「エンジン性能」「燃費の良さ」「デザイン性」「安全技術」などいくつかの指標を用いるのはご存じでしょう。しかし“それぞれの指標がどの程度重要なのか”はすぐには分かりません。こうした複数の指標が存在する場合において、それぞれの関係性を明らかにすることが、多変量解析を用いる目的になります。
多変量解析を用いると、複数のデータの関連性が見えるようになり、データの活用がしやすくなります。

多変量解析の目的

多変量解析の目的には「予測」と「要約」の2つがあります。さまざまなデータをまとめて分析することで、先々の予測を立てたり、複数のデータをまとめたりするのが多変量解析の目的なのです。以下の項目では、多変量解析の目的について、詳しく解説します。

データから「予測」する

多変量解析の目的のひとつに「予測」があります。小売店であれば「曜日・時間帯ごとの顧客数」「商品の売れ行き」「店員数」「在庫数」「立地」「天候」などのデータを多変量解析して、今後の顧客動向や売れ行きを予測できるでしょう。このように多変量解析は、先々の予測をすることを目的として行うことがあります。
また、今ある店舗だけでなく、新店舗や新規サービスについての予測にも多変量解析は役立ちます。どこにどのような店舗を作り、どんなサービスを展開すれば顧客が来てくれるのかが、過去の傾向を用いて予測できるのです。

データから「要約」する

複数のデータを「要約」するのも、多変量解析を行う目的の1つです。多変量解析で扱うさまざまなデータは、一見なんの関連性もないように感じる場合があります。しかし、多変量解析を行うとデータ間の関連性が明確になり、データを深く理解するのに役立つのです。
例えば、「理科」「数学」の成績データを用いれば、その人の理系能力が分かるでしょう。このように、いくつかのデータを要約して理解しやすくするのが、多変量解析を用いた要約の効果です。

多変量解析でできること

多変量解析を使ってデータの解析を行うと、以下のようなことが実現できます。

【多変量解析でできること】
●「来店データ」や「過去の天気データ」などを用いて、曜日や時間帯ごとの売上を予測する
●「使い心地」「価格への納得感」「選んだ理由」などの消費者アンケート結果を用いて、商品の改善ポイントを洗い出す
●「広告宣伝費の配分」「宣伝方法」「宣伝場所」「時間帯や曜日ごとの反応」などのデータを用いて、効果的な宣伝方法を考える
●「年齢」「性別」「既往歴」「血圧」「身長・体重」などのデータを用いて、どんな人がどんな病気にかかりやすいかを把握する
●「曲の長さ」「速さ」「キー(調性)」「メロディーの音域」などのデータを用いて、売れる曲の特徴を考える

上記のように、さまざまなデータを活用して特定の事柄に関する情報を導き出すのが、多変量解析で実現できることと言えるでしょう。

多変量解析で取り扱う2種類のデータ

多変量解析で取り扱うデータには「量的データ」と「質的データ」の2種類があります。それぞれ特性が異なり、多変量解析で予測をしたい際には「量的データ」を用いる必要がありますので、注意しましょう。「量的データ」と「質的データ」の詳しい内容は、以下で解説します。

量的データ

質的データとは、数値で表せるデータのことです。「人数」「血圧」「売上」「価格」などが質的データに該当します。多変量解析で何らかの予測をしたい場合、用いるのは量的データに絞る必要があるでしょう。数値で示せる具体的なデータのため、より正確な予測を立てられるためです。なお、量的データにも2種類に分けられます。

 ●間隔尺度
 ●比例尺度

「間隔尺度」は数値の間隔に意味があるもので、気温や西暦などが該当します。平均値や中央値、標準偏差などを出すのに用いるものです。「比例尺度」は基準点や絶対零点が存在し、数値の比に意味があるもので、金額や身長などが該当します。

質的データ

質的データとは、数値で表せないデータです。「好き嫌い」「性別」などが質的データに該当します。質的データは、多変量解析で要約をしたい際に用いるのが一般的です。なお、量的データは以下の2つに分けられます。

 ●名義尺度
 ●順序尺度

名義尺度は、データを分類するためのものです。住所や性別、職業などが名義尺度に当たります。順序尺度は、順序や大小には意味があるものの、数字の間隔が均等とは限らないものです。順位や等級などが順序尺度にあたります。

多変量解析を行う手順・流れ

多変量解析の特徴や目的が理解できたら実際に解析を行ってみましょう。複数のデータを扱うため難しいと感じるかもしれませんが、そこまで複雑な解析ではありません。また、さまざまな答えを導き出せるので、解析する楽しさを感じる方も多いかと思います。

データを収集する

まずは、解析に使用するデータを集めましょう。データ収集をする際は「データ収集の目的」と「活用方法」を決めてから、収集作業に取りかかってください。目的や用途がはっきりしていないと、何のデータを集めるべきかが不明確になったり、実際に集めたデータから知りたい情報が得られなかったりする可能性があります。

また、収集したデータは「データクリーニング」を行いましょう。データクリーニングとは、不適切な回答や重複回答、誤回答などを排除・修正する作業です。データクリーニングを行うと、より正確なデータを用いて多変量解析ができます。

1. 変量解析(単変量解析)を行う

データが収集できたら、それぞれのデータ(変量)を解析しましょう。各データを解析することを「単変量解析」といい、具体的には以下の作業を行います。

 ●外れ値・異常値の検出と処理
 ●分布状況の確認

「外れ値」とは、ほかの値から大きく外れた値です。箱ひげ図やクラスター分布などを用いて検出しますが、外れ値に見える正常値の場合も多くあるため慎重に扱いましょう。そして、外れ値の中で明らかに正常でないと考えられる数値は「異常値」として、削除や修正を行います。

2. 変量解析(2変量解析)を行う

それぞれのデータ(変量)の解析が完了したら、各データ同士の相関性を調べるために「変量解析」を行います。変量解析には、クロス集計表や散布図など、データの相関性が可視化されるものを用いると良いでしょう。通常の変量解析では、2つの変量を用いる「2変量解析」を行います。

クロス集計表や散布図で変量解析を行うと、明らかに平均的な範囲から外れた「外れ値」があるかもしません。外れ値があった場合は、内容を精査したうえで、明らかに異常な値であれば「異常値」として削除・修正を行ってください。

3. 多変量解析を行う

変量解析まで完了したら、いよいよ多変量解析です。多変量解析は、専用のソフトを使って行うのが一般的です。多変量解析ソフトには「JMP(ジャンプ)」や「SPSS」「SAS(サス)」などさまざまなものがあります。Excelをはじめとした表計算ソフトでも多変量解析を行えますが、作業がかなり煩雑になるため、専用ソフトを使用するのがおすすめです。

多変量解析を行う際は、目的に合わせた解析が必要である点に留意しましょう。多変量解析にはさまざまな手法があり、目的に合わせて選択する必要があります。データ分析の手法については、次項で詳しく触れますので、参考にしてください。


20230908_02

多変量解析で使われるデータ分析手法の種類

多変量解析で使われるデータ分析手法には、多変量解析を行う目的によって以下の種類があります。

■多変量解析の目的:要約
データ分析手法の名称 概要
主成分分析 大量の量的説明変数がある場合に、変数をいくつかの主成分(カテゴリ)に分類して整理する手法。
因子分析 大量の変数があった場合に、その変数となった背景を解析するために用いる手法。
多次元尺度構成法 プロダクトマップなどを用いて、類似しているデータをそれぞれ近い位置にまとめて、
視覚的にわかりやすくする手法。
コレスポンスデンス分析 クロス表の結果を、グラフ化して視覚的に見やすくする手法。
クラスター分析 異なるものが混在している集団から、類似したものをまとめて、分類する手法。
潜在クラス分析 量的データと質的データが混在している中から、類似したデータをグループ化する手法。
複数のグループに属するような、あいまいなものも認めるのが特徴。

多変量解析の目的:予測
データ分析手法の名称 概要
判別分析 データが複数のグループに分かれていた場合に、分かれている基準を解析する手法
重回帰分析 多変数の中からひとつを目的変数に設定し、その他の変数が目的変数にどのような影響を与えるかを解析する手法。
コンジョイント分析 消費者が商品やサービスを選ぶときに、どの評価項目をどのくらい重視しているかを解析する手法。
ロジスティック回帰分析 複数の説明変数から、2択の結果(合格・不合格や当選・落選のようなもの、目的変数)が
得られる確率を分析する手法。
決定木分析 樹形図(ツリー)を用いてデータを分析する方法。
樹形図は、Yes・No選択チャートのようなもの。

■多変量解析の目的:因果関係の把握・その他
データ分析手法の名称 概要
選好回帰分析 消費者が製品やサービスに対してどのような感情を抱き、どのように比較・選択しているかを構造化する手法。
数量化Ⅰ・Ⅱ・Ⅲ類 数量化Ⅰ類は重回帰分析、Ⅱ類は判別分析、Ⅲ類は主成分分析もしくは因子分析を指す。
各分析手法は説明変数に「量的データ」を用いるものだが、数量化Ⅰ・Ⅱ・Ⅲ類は質的データを扱えるため、
説明変数を適切に扱えるようになる。

上記のように、多変量解析の手法にはさまざまなものがあります。解析の目的に合わせて、最適な手法を選べるように、上記表の内容をある程度覚えておきましょう。

多変量解析を実施する際の注意点

それでは、多変量解析を行えば、あらゆるマーケティング課題・リサーチ課題が明らかになるのかというと、実際はそうではありません。注意しなければならないことはたくさんありますが、今回は注意すべき点を3つに絞ってご紹介します。

 1. 分析作業が目的になっていないか?
 2. その結果は使えるものかどうか?
 3. データは丸めてしまっていいものなのか?

分析作業が目的となっていないか

リサーチの仕事をしていると、ついついその先にあるマーケティングアクションではなく、目の前のリサーチ課題を解決することに気が向いてしまうことが多々あります。

つい先日、あるファッションブランドのリサーチで「重回帰分析(※1)を用いて、認知度がどう影響して、ブランドイメージから構成されているかを見たい!」というオーダーを受けました。一見、「認知度」を“外的基準”、「ブランドイメージ」を“内的基準”として分析をすれば、課題に対しての答えが出そうですが、これは正しいでしょうか? 答えは“No”です。

なぜなら、ブランドのイメージは認知後に醸成されるものであり、ブランドのイメージが認知度に影響を与えることは理論上あり得ないからです。これは非常に単純な例ですが、このように分析作業を目的としてしまうと、よく考えればありえない構造の分析にも気がつかないことがあります。そうならないためにも、マーケティングリサーチに携わる人間は、必ずマーケティング課題に沿った分析を考えなければなりません。

(※1)重回帰分析・・・多変量解析のひとつ。一つの目的変数と複数の説明変数で説明・予測できると仮定して行う分析手法。売上予測などに使われる。

その結果は使えるものになっているか

多変量解析を行う際に、しっかりとした仮説を持たずに調査・分析をすると、結局使えない結果を導きだしてしまうことが多々あります。たとえば、クラスター分析(※2)を用いて、一般生活者を5つのクラスターに分類してターゲット検討をするとします。しかし、一体どのクラスターがターゲットなのか?また、そのクラスターはどこにいるのか?が分からないままに調査が終わってしまうことがよく見られます。

リサーチ担当者・企画者に十分な仮説がなかった場合や、マーケティング担当者が自分たちの顧客像をイメージできていなかった場合は、このような結果になってしまいがちです。また、「クラスター分析をすれば、何かターゲットが出てきそうだ!」と多変量解析に過度な期待をしてしまったときにも、同様のことは発生します。

実際には、後者のような過度の期待が理由で多変量解析の結果がうまく使えないということが発生しているのが大半のようです。安易に多変量解析を行い、それでなんでも解決してくれるかのような認識は改めなければなりません。

(※2)クラスター分析・・・多変量解析のひとつ。回答傾向の似たサンプルを集めて、いくつかのグループ(クラスター)に分類する分析手法。

クロス分析で丁寧に調査したか

多変量解析は、文字通り多くの変数(変量)を使って、ある事象を説明・解明しようとする方法です。この時に、アンケートで聴取した大量のデータを集約したり、一部データを排除したりすることがあります。アンケートで聴取したローデータを原石とすると、多変量解析は、その表面の粗さを研磨する作業に似ています。

つまり、ローデータ(聴取されたすべてのデータ)を100%反映した結果にはならないのです。時として非常に重要な質問も集約された情報の一部となってしまい、「この質問はピンポイントで分析したいのに」ということが起こり得ます。そういった細かな違いや特徴を分析するには、多変量解析でキレイに研磨されたデータを見るだけでは足りません。ローデータのクロス分析(集計表)を見ることで、表面のギザギザを丁寧に分析してあげる必要があります。

以上のように、多変量解析は決して万能なものではなく、ケースバイケースで正しく使用する必要があります。マーケティングリサーチに携わる人間は、豊かなマーケティングセンスと正しい統計知識を磨くことが必要不可欠であり、そういったノウハウを持つことが我々マーケティングリサーチ会社の価値であると思っています。

まとめ

多変量解析は、複数のデータを分析するのに有効なものです。目的によって使える手法が異なるので、取り組み前に「解析の目的」を明確にしたうえで、取り組むようにしましょう。また、多変量解析に用いるデータを収集する際も、目的を見失うと、得たい情報がまったく得られなくなる可能性があります。「なんのために解析をするのか」「何に関する情報を求めているのか」を考えたうで、適切なデータ収集と解析を行えば、これまで見えていなかった新たな事実に気付くきっかけになるでしょう。

関連コラム

マーケティングコラム
クラスター分析で見えてくるシングルソース活用の幅
マーケティングには様々な手法がありますが、ビッグデータの浸透によりクラスター分析が盛んになりました。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
クロス集計は分析の基本!メリットと分析できることを解説
アンケート調査で得られたデータの集計方法の一つにクロス集計があります。今回は、クロス集計のメリットとクロス集計でできる分析について解説します。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
効果的なデータ分析・データ活用をする上で大切なことを解説
インターネット通販の広がりや本格的なIoT時代を迎え、企業には大量のデータが入ってくるようになりました。しかし、こうした貴重なデータをマーケティングや課題解決に活用するのはまだまだこれからという企業も多いようです。データという宝の山をどう発掘し有効活用していくのか、データ分析の能力とノウハウが企業の成功に直結します。今回は、データ分析を行う前に把握しておくこと、データを活用する上で大切なことについて解説します。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
ディシジョンツリー分析の手順とビジネスへの適用処理
ビジネスでは、顧客の動向や商品の購買データなどを分析して、今後のビジネス活動に有効な情報を採掘するデータマイニングが頻繁に使われます
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
アドホック分析を効果的に活用する手法と留意点
マーケットリサーチやビッグデータの処理にはアドホック分析がよく使われます。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
データマーケティングコラム
誰でも手軽に活用できるバスケット分析のメリットと実施方法とは?
小売店などでは、購買時の顧客行動を分析し、売り上げアップにつなげることは至上命題といえます。例えば特定の2つの商品について売り上げの関連性を見つけられたとしたら、売り上げアップに大きな効果が望めそうです。そのような2つの商品の売り上げについて、関連性を手軽に分析できる手法が「バスケット分析」です。今回はバスケット分析について、そのメリットや注意点、実施方法などをお伝えしていきます。
# データマーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
データマーケティングコラム
購買分析におけるアソシエーション分析とバスケット分析の違いとは?
アソシエーション分析とバスケット分析は、共に小売店での購買分析に役立つ手法です。どちらも有名な手法のため、自社の分析において活用実績があることも多いでしょう。しかしながら、アソシエーション分析とバスケット分析の違いについてはよくわからないという方もいらっしゃるのではないでしょうか。今回は、アソシエーション分析とバスケット分析の違いについて、アソシエーション分析の実施例や実施方法なども合わせてお伝えしていきます。
# データマーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
アンケートの統計・分析|成功に導くためのポイントや分析方法をご紹介!
サービスや商品の問題点を発見し、改善や新たな施策に活かす際に役立つ「アンケート調査」。しかしアンケート調査は、統計の考え方を理解した上で実施・分析しないと、ムダになってしまう恐れがあることをご存知ですか。今回は、アンケートを実施する上で重要な「統計」をはじめ、おさえておきたいポイント、アンケートの集計や分析の方法などを解説します。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
統計学とは?活用する手法に種類はある?目的別に分析手法をご紹介!
「顧客のデータやアンケート結果はあるのに活かせていない」「顧客満足度を向上してリピート率を高めたい」 そんな悩みの解決に役立つのが「統計」です。統計を使うと、大量のデータから有益な情報を得ることもできますが、そのための手法は複数あります。そこで今回は、21世紀のビジネスパーソンならば1度はチェックしておきたい「統計分析の手法」について解説します。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
マーケティングコラム
ウエイトバック集計とは?計算方法や適切なケース・手順をわかりやすく解説
ウエイトバック集計とは、アンケート回収時などに用いられる集計方法です。別名「ウエイト付き集計」とも呼ばれます。ウエイトとは「重み」を意味する「Weight」のことで、要約すると「サンプル(回答)に重みを加えて集計する方法」のことを言います。今回はウエイトバック集計の計算方法とクロス集計との関係性を解説します。
# マーケティングコラム
業界/業種
支援領域
開催日:-
受付終了
ご相談・お見積もり依頼
【法人・個人様】
フリーダイヤルでのお問い合わせ
0120-198-022
※ モニター様からのお電話でのお問い合わせは受け付けておりません。
資料ダウンロード