マーケティングコラム
【新しい時代のリサーチ 第2回】「正確な選挙予測を可能にしたRDITの方法論」
公開日:
(株)クロス・マーケティンググループ
クロスラボ 研究員
岸田 典子 (きしだ のりこ)
前回のコラムで、2016年11月の米国大統領選挙を正確に予測した調査RDIT(アールディット:Random Domain Intercept Technology)とその特長についてご紹介しました。今回はこのRDITがなぜ正確なのか、またその仕組みについてもう少し詳しくご紹介したいと思います。
RDITの調査が正確な理由 「ランダム性」
RDITの回答者は従来のインターネット調査と異なり、アンケートに回答しようと思った人ではなく、偶然にそのページにアクセスした人となります。調査の導入ページは、通常性別と年代の質問です。そこで回答を続けるかどうかは、対象者の自由意志に任されます。調査を拒否する自由がある点では他の手法と変わりはないですが、調査協力の対象範囲は関心がある人だけに限定されず大きく広がったことは確かでしょう。
また、ドメインが固定されたWebサイトではないため、意図してこの調査ページを見つけることはほぼ不可能です。この調査を妨害することは全インターネットを遮断しない限りできません。そのため、たとえ言論を封殺するような権力下にある国であっても、その国の一般市民の声を正確に集めることができるのです。
(図1) 調査の導入画面の例(日本の場合)
「対象とする個人の集団からのランダム性は、調査パネルや他のデジタル手段では得られない最も必要不可欠な要素です。ほとんどの選挙予測は、今回の私たちの予測に近づくことすらできませんでした。人々が完全にランダムに抽出されるという私たちのテクノロジーの事実が、私たちの示すデータが細部まで正確である理由であり、従来の世論調査が普段意見を言わない人々の声を計測することに失敗し続けている理由です。今までの主要な世論調査のデータ収集のメカニズムにランダム性に欠けていることはもっと重視されるべき問題です。」
RDITによるアメリカ大統領選の予測はどのように行われたのか
今回は、毎日継続的に実施するデイリー・トラッキング調査が行われました。RDITには、回収データがすぐに反映されるオリジナルのダッシュボードがあり、回収データと性別・年令別のウエイト付きのデータがすぐに確認できるようになっています。日次のデータはやや変動しやすいため、7日間の移動平均が用いられました。 投票日の1か月前から調査を開始し、分析には、両候補の差が最も開いた日である10月19日から分析日11月4日までの計17日間のデータが用いられました。 調査の結果を示した下記のグラフをみると、10月19日時点でのクリントン氏の得票数の予測は253票とトランプ氏よりも優勢でしたが、分析日直前に両候補の勝敗が逆転したことがわかります。(図2)
11月8日に投票が行われた今回の米国大統領選挙に向けて、実際にどのように予測したのかをRIWI社のCEO ニール・シーマン教授に質問しました。 以下はその回答です。
「今回の調査は、州レベルで適切なタイミングで予測をするために、選挙人投票に最も影響を与える州に焦点をあてることが課題でした。 予測を行う適切なタイミングは、選挙の機運が明らかにトランプ候補に有利になった11月4日でした。11月4日時点で、トランプ候補が少なくとも193票の選挙人投票を確保する一方、クリントン国務長官が138票であると推計し、トランプ氏側の勢いと確実な勝利を予測しました。クリントン氏の支持は、州レベルで数週間にわたって継続的に急激に下降していました。 11月2日時点では、選挙結果に重要な意味をもつノースカロライナ州ではトランプ氏支持、フロリダ州とミシガン州では両候補が統計的に同レベルでした。ノースカロライナ州は極めて重要な州ですが、トランプ氏がますます上昇に向かっていました。そして11月4日金曜日、東部標準時間の正午に私たちはクライアントに対し予測結果を伝えました。 最も重要なのは、私たちは、フロリダ州、ノースカロライナ州、オハイオ州、ペンシルバニア州における選挙の機運と勝利予測が明らかにトランプ氏支持であったことから、トランプ氏が勝利に向かっていることを知っていたということです。 11月8日火曜日の投票日の夜(東部標準時の午後9時半頃)、私たちが予測した通りにCNNが極めて重要な州であるフロリダ州においてトランプ氏が選挙人投票の勝利を確実にしたことをテレビで伝えました。」
※フロリダ州のトランプ氏の正式な当確の報道はテレビのネットワークによって異なるが上記よりも遅く、CNNのフロリダ州でのトランプ氏の正式な当確は2時間遅い午後11時34分であった。
【分析結果】
・10月19日から11月4日までの各候補の相関を求めた。(相関係数、標準誤差はグラフ内に記載)
・11月4日時点で トランプ氏174票 クリントン氏162票を確保。予測では、トランプ氏193票、クリントン氏138票で、トランプ氏の勝利。
・総得票率では、クリントン氏51%、トランプ氏49%と予測。
(図2) RIWI社による分析結果
予測による質問
「対象者に本人の投票意向ではなく予測の質問をしたのは、米国が直接投票ではないことも理由の一つではありますが、個人の投票意向の質問はさまざまなバイアス(偏り)を生じます。常にバイアス(偏り)があるがゆえに真のランダム性が重要なのです。予測による質問は、社会的望ましさ(Social desirability)によるバイアス(偏り)を取り除くためですが、特に今回のように注目を集めるメディア、ジャーナリスト、世論調査会社、学術団体の大多数が強く反対していたトランプ氏の選挙においては大きな懸念点でした。
従来の世論調査では、予測の質問を含むことはほぼありません。けれども住民による集合的な予測による回答は、選挙予測において可能な最も正確な方法であることを調査結果は示しています。
多くの場合、バイアスを減らすために質問を『パーソナライズ(個人化)させない』ことは極めて重要です。私たちは、世界のさまざまな地域の援助開発や企業の非常にセンシティブな事柄を数多く扱っています。例えば、誰かが『賄賂を受け取ったか』と質問するよりも、誰かが『賄賂を受け取った近隣の親しい友人や職場の同僚を知っているか』と質問するほうがよいのです。」
従来の世論調査による予測の難しさ
正しく予測できることの価値
よく考えなければ回答できないような質問や回答するのが嫌になるような質問をして、得られた回答を「いいかげんな回答」と呼ぶ人もありますが、それはある意味で幅広い人々の意見を吸い上げることをあきらめているのと同じかもしれません。
以上のように今回はRDITがアメリカ大統領選を正確に予測できた理由と従来の調査手法との違いや考え方について簡単にご説明してきましたが、興味をもっていただけたでしょうか。今回のアメリカ大統領選挙がきっかけとなり、正しく予測できることの価値の大きさに改めて気づかされます。このようなRDITの調査結果の精度を生かし、新しい指標を作ることも可能ですので、ぜひご活用いただければと思います。
<参考>
◆RIWI社プレスリリースより
2016 US Election: Predicting Electoral College for President-Elect Trump and the Popular Vote for Clinton
(2016年米国選挙:トランプ大統領候補の選挙人投票の勝利 得票率でクリントン候補の勝利を予測)
https://riwi.com/wp-content/uploads/2016/12/2016USElection_PredictionMethodology_FINALvforSite.pdf
◆BC News Japan【米大統領選2016】トランプ氏のブレグジット的逆転は可能か
10月31日付け記事
http://www.bbc.com/japanese/features-and-analysis-37819864
*オリジナル・ダッシュボードは、長期やトラッキング案件のみ利用可能です。
関連ページ