マーケティングコラム
ウエイトバック集計とは?計算方法や適切なケース・手順をわかりやすく解説
公開日:
コンテンツディレクター
WEBライティング~メディアの制作ディレクション業務・SNS運用・YouTubech運営/広告運用などで活動しているWEB系フリーランス。
SEO,YouTube,Twitter,Instagram,TikTokの集客媒体全般で集客・コンテンツ制作経験あり。読者・視聴者の潜在ニーズを拾い上げ「見たくなるコンテンツ制作」を意識しています。運営したYouTube漫画 chでは売上20倍に貢献。記事制作に携わったメディアは30サイト以上。現在は、SEOのコンテンツ制作をメインの業務としています。
武田 竜輔
ウエイトバック集計とは
ウエイトバック集計とは、回答率や母集団の偏りを考慮してデータを修正する方法です。専門的な言い方をすれば「アンケート回答者の構成と母集団の構成が異なっている場合に、母集団の構成にあわせて集計しなおす方法」となります。例えば、男女比4:6の会社において調査を行った際に、回答率の男女比が6:4になっていた場合、男性と比べ女性の回答率の方が低いため女性の意見が反映されにくいデータになっていると考えられます。
こうした調査データの偏りを、母集団の状況に合わせて修正していくのがウエイトバック集計です。ウエイトバック集計を利用することで、母集団全体から回答を得られなかったとしても、おおよそ全員の意見が反映されたデータとして調整をして分析することが可能です。
クロス集計との関係性
クロス集計では、あらゆる属性によって分析軸が分けられており「どの年代で男女どちらに人気があるか」など、細やかな調査結果をつまびらかにできます。このようなクロス集計では、分析軸(属性)によって、ウエイト値が変わってきます。そのため、このウエイトバック集計を用いることで、各分析軸の重みを集計結果に加えて比較することに役立ちます。ウエイトバック集計が最適なケース・おすすめしないケース
しかし、クロス集計のすべてにこのウエイトバック集計を行うことが適切だとは限りません。ここからはウエイトバック集計が最適なケースと、あまり用いるべきではないケースをみていきましょう。ウエイトバック集計が最適なケース
ウエイトバック集計が最適なケースとしては、回答者と母集団の構成それぞれが明確に分かっている場合です。また、サンプルサイズ(回答者数)が明確になっているケースも、ウエイトバック集計が最適であるといえます。そもそもウエイトバック集計は、回答者と母集団の構成が異なる場合に、母集団の構成にあわせてデータを補正する手法です。そのため、回答者と母集団の構成が分からなければ、ウエイトバック集計は行えません。
また、サンプルサイズがあまりにも小さい(回答者数が少ない)場合、ウエイトバック集計をすることで1人の回答が2倍に解釈されてしまう、といったトラブルが発生します。補正によって、1人の回答の違いがあまりにも大きくなりすぎてしまうのです。そのためサンプルサイズが大きければ、ウエイトバック集計をしても問題ないといえます。
ウエイトバック集計をおすすめしないケース
ウエイトバック集計をおすすめしないケースとしては、調査でサンプルサイズが小さい少人数の調査や、定性調査などがあげられます。少人数に対する調査の場合、前述したように1人の意見が倍に解釈されてしまうことになり、適性なデータが得られない可能性が高まります。また、定性調査についてもウエイトバック集計をおすすめできません。定性調査とは、数値で測れない事柄を調べる調査です。例えば、座談会形式での顧客満足度調査や、対象者の行動観察などを通して傾向を調べるといったものが定性調査に該当します。調査結果を数値化するのが難しいので、ウエイトバック集計を用いるのは難しいでしょう。
そもそもウエイト付けができないケース
また、ウエイト値の算出ができない場合は、そもそもウエイトバック集計をすることができません。マーケティングリサーチにおいて、母体数が明確に判明しているシーンというのは、意外と少ないものです。あらかじめ人数を決めてモニターを募集した調査などであれば、母体数を求めるのは容易です。しかし、「商品のユーザー数」や「傍目にはわかりにくい(または当人も自覚していない)症状を持つ人数」など、総人口が不明な場合は、母体数が不明であるためウエイト値を出すことができません。ウエイトバック集計のやり方
ウエイトバック集計は、正しい手順で行わないと適切なデータが得られません。以下で、正しい集計の手順を4ステップで解説します。
1. アンケート調査を実施
まずはアンケート調査を行いましょう。調査は数値的な結果がえられる定量調査を用いるようにしてください。サンプル数の多さも大切です。ウエイトバック集計で用いる「ウエイトバック値」は、最大で2程度となります。そのため、集計によって値が大きくなりすぎない程度にはサンプル数を確保しなくてはなりません。
また、母集団と回答者に関する構成も把握できるようにしましょう。具体的には、年齢や性別などの数値をまとめておくと、ウエイトバック集計を行いやすくなります。
2. 補正項目と補正方法の決定
調査結果が出そろったら、補正項目と補正方法を決めていきます。補正項目とは、どの項目を補正するかです。そして補正方法については「30代と40代を2:3になるように補正する」「日本の人口比率と揃える」など、何を基準として補正するかを決めていきます。補正方法が決まっていないと、後述するウエイトバック値が求められず、何をどのように補正すればいいのかが分からないでしょう。ウエイトバック集計を行ううえでは、まず補正項目と補正方法を決定しておくことが大切です。
3. ウエイトバック値の算出
補正方法が決まったら、ウエイトバック値を求めていきます。ウエイトバック値とは、補正につかう数値のことで、具体的には補正項目に何を掛けて補正するのかを意味する言葉です。まず母集団と回答者の構成比をそれぞれ求めたうえで、回答者の構成比を母集団の構成比に揃えます。
例えば、800人の母集団の比率が「1:2:1」で、回答者数が500だった場合で考えてみましょう。ウエイトバック集計では500人を母集団の比率に揃えて分配し「100人:200人:100人」という回答者数になるよう補正します。そして「母集団と同じ構成比の人数 ÷ 実際の回答者数」を計算すると、ウエイトバック値が求められます。
4. ウエイトバック値を利用して調査結果を補正
ウエイトバック値が求められたら、あとはデータに値を掛けていくだけで、補正した数値が求められます。エクセルで各数値を設定すればよいので、簡単にできるでしょう。間違えやすい値の計算方法
例えば、男子生徒100人、女子生徒100人の学校を対象にしたアンケートを行い、男子生徒の回答数が80、女子生徒の回答数が50だったとしましょう。この場合、男女の構成比の調整は「男子生徒の回答を30破棄して、女子生徒と同じ回答数にすれば簡単ではないのか?」と思ったかもしれません。しかしそれでは、切り捨てた票数の中に偏った意見があった場合に、正当な集計が行われたとは言えなくなってしまいます。また、構成比だけを改めても、サンプル数が合わなくなってしまうことがあります。
「母集団数」とは、調査対象の全体数は何人か、ということです。上記の例で言えば、男子生徒・女子生徒のそれぞれの総数(100人)に該当します。「回収数」は属性別のアンケート回収の数(男子80、女子50)に、「総回収数」はアンケートの全体の数(130票)となります。ウエイトバック集計では、このウエイト値(重み)を回収数にかけ合わせ、算出された補正後の値を集計結果とします。
よって、
80(補正前の値)×0.8125(ウエイト値)=65(補正後の値)
50(補正前の値)×1.3(ウエイト値)=65(補正後の値)
このような計算をして、男女比を全体の構成比と同じ1:1にすることで計上します。
ウエイトバック集計で最も間違いやすいのは、このウエイト値の算出を「数」からではなく「構成比」から算出してしまうミスです。この方法では、構成比は同じ値となるものの、総数が元の値のままとなってしまい、まったく違った集計結果となってしまうので、注意が必要です。
ウエイトバック集計の事例
では、実際にウエイトバック集計を使ってデータを補正してみましょう。今回は、とあるファンクラブの満足度に関する以下のデータを使用します。ウエイトバック集計の注意点
ウエイトバック集計はより実態に即したデータを得るのに有効ですが、いくつかの注意点もあります。以下では、ウエイトバック集計の注意点を3つご紹介します。ウエイトバック値が高いと信頼性が下がる
最初の注意ポイントは、ウエイトバック値の大きさです。ウエイトバック値が大きすぎると、補正した前後の数値が乖離してしまい、調査の信頼性が低下します。ウエイトバック集計は、あくまで回答者と母集団の構成が異なっている場合に補正する集計方法です。
集計によって調査結果が大きく変わってしまうのは、補正がききすぎてしまって、適切なデータとはいえない結果となります。補正前後の結果が乖離している場合は、そもそもウエイトバック集計をつかうべきなのかを慎重に検討する必要があるでしょう。
ウエイトバック値は、大きくても2程度までには収まるようにします。2以上になってしまう場合は、そもそも回答率が悪い可能性が高いです。調査方法を見直し、より適切な回答を得られるような調査をしたほうがよいでしょう。
使うか・使わないかの判断が必要となる
回答者と母集団の構成が異なるからといって、必ずしもウエイトバック集計を使うべきとは言い切れません。前述したように、ウエイトバック集計が適しているケースと、そうでないケースがあります。まずは調査結果や母集団の状況などを見直し、本当にウエイトバック集計を使うべきか考える必要があります。また、どんな調査結果が欲しいかによっても使うべきかの判断は異なります。
例えば、利用者数に関する調査にウエイトバック集計をしてしまえば、正しい利用者数が分からなくなってしまうでしょう。どのような状況においても使える集計方法ではないので、ウエイトバック集計を用いるのが適性かどうかは慎重に見極める必要があります。
精度はデータにも依存する
ウエイトバック集計の精度は、データの内容に大きく依存します。アンケートの回答数が少ない場合や、回答者の構成比が把握できない場合には、ウエイトバック値がおかしくなってしまうためです。サンプル数が多く、構成比が明確に分かっている場合であれば、ウエイトバック集計の精度は高まるでしょう。正しい集計を行うために、まずは良質なデータを収集しなくてはなりません。ウエイトバック集計をするからといって、もともとのデータの回答者構成比が偏っていたり、回答者数が少なかったりしても問題ないと考えないようにしましょう。
まとめ
ウエイトバック集計は、サンプル数が多く回答者と母集団の構成比が明確になっている場合であれば、とても有益な手法になります。回答率が若干悪かったとしても、より実態に近いデータが得られるようになるでしょう。回答率の偏りが出やすいアンケート調査に対して積極的に活用していきましょう。一方で、構成比が明確でない場合やサンプル数が少ない場合、そもそも数値的なサンプルを得られない定性調査であった場合などは、ウエイトバック集計はおすすめできません。使用するかどうか慎重に判断したうえで、有効活用していきましょう。
関連ページ