衆議院議員選挙とYahoo!検索の驚くべき関係

政治・選挙
ビッグデータを活用して探る衆議院議員選挙とYahoo!検索の驚くべき関係を説明するタイトル画像。Yahoo! JAPANビッグデータレポートと記載され、選挙の投票を連想させるイラストが右側に配置されています。

※ヤフー株式会社のコーポレートブログに掲載した記事を再掲載しています。

こんにちは、Yahoo! JAPANビッグデータレポートです。

今回は、Yahoo! JAPANが持つ膨大なデータをいろんな角度で分析することで新しい発見を見いだせるのではと取り組みをはじめた"Yahoo!ビッグデータ"の一環として、12月16日に投票が行われた「第46回衆議院議員総選挙」の結果と、「Yahoo!検索」や「Yahoo!検索(リアルタイム)」などのビッグデータを比較・分析・調査してみました。

そうしたところ、選挙結果とビッグデータには思いもよらない関連性が見つかったのです。

この記事ではその内容をダイジェストでお伝えします。
報告レポートは記事の一番最後から見ることができます。是非ご覧ください。

若者の選挙に関する関心

まずは若者の「選挙」そのものへの関心を調査してみました。
選挙では常に若者の関心の低さが話題となりがちですが、実際にはどうなのでしょうか?

それを調べるため、「Yahoo!検索」全体の年代別構成に対して、「選挙」やそれに関連したワードを検索した人たちは、どのような分布になっているか分析しました。
その結果が以下の表です。

選挙関連ワードの検索者の年代構成

グラフは選挙関連ワードを検索したユーザーの年代構成を示している。19歳以下から60歳以上までの年代別の割合が、選挙や政策に関する検索ワードごとに棒グラフで表される。特に20代と30代の関心が高いことが示されている。

(集計期間:2012年12月4日~15日 以下注記ない場合はすべて同様)

その結果、「選挙」と検索するユーザーはむしろ「Yahoo!検索」全体の年代別構成に比べて若い人が多いという結果となり、少なくとも関心が低いわけではなかったと推測することができます。
また、選挙の争点となった各ワードの検索に関して、「TPP」は20代が占める割合が他と比較しても突出して多いという傾向が見られるなど、それぞれに特徴が現れる結果となりました。

さらに掘り下げて、政党名検索での男女比率と年代別構成を抽出したのが以下の表となります。

政党名検索者の男女比率

グラフは、政党名検索者の男女比率を示しています。公明党では女性の検索比率が最も高く32.1%、社民党や日本未来の党は男性比率が高く75%を超えています。データは2012年12月4日から15日までのものです。

政党名検索者の年代比率

政党名検索者の年代比率を示すグラフ。各政党ごとの検索者の年代構成が%で示され、30代以下と40代以上での比率が視覚化されている。日本共産党は30代以下が多く、新党大地は40代以上が多い。

※記事初出時、グラフ内の数字に誤りがありましたので修正をしました(2013年1月8日更新)

政党によってかなり特色があることがわかります。
男女比では公明党やみんなの党で女性の検索比率が多く、逆に社会民主党や日本未来の党は男性比率が高い結果になりました。
年代別では共産党で検索する人の8割近くが30代以下である一方、新党大地や日本未来の党の検索者の6割は40代以上になるなど、政党によって関心を持たれている年代が大きく異なっています。今回大勝した自民党はほぼ真ん中に位置する結果でした。

検索数やSNS投稿数と選挙結果との関係

次は「Yahoo!検索」の検索数や、「Yahoo!検索(リアルタイム)」のビッグデータからSNS投稿数を抽出し、これらのデータと選挙結果に何らかの関連性がないかを調査しました。
具体的には、公示日の12月4日から投票前日である12月15日の各政党名の「Yahoo!検索」での総検索数、および「Yahoo!検索(リアルタイム)」を使用してSNS投稿数(Twitter、Facebook、Yahoo!ひとことを対象)を集計し、小選挙区、比例区の得票数と獲得議席数の数字との比較を行いました。
すると、検索数、SNS投稿数それぞれにおいて興味深い発見がありました。

まずは検索数との関連について。もっとも興味深い関連性が見つかったのが比例区の得票数です。

政党名の検索数と比例区結果との相関

2つの散布図グラフが並んでいます。左のグラフは、主要な政党名の検索量と得票数の相関を示し、相関係数は0.946です。右のグラフは、主要な政党名の検索量と議席数の相関を示し、相関係数は0.932です。

縦軸が各政党の比例区得票数、横軸が検索量を指数化したものです。
それを散布図として見てみると、多くの政党が一直線上に並ぶほどの非常に高い相関があることがわかりました。
さらに、その中でも一部の政党では面白い特色があるのもわかります。
公明党は他の政党と比べ、検索されないが得票数は非常に多かったということ、また逆にみんなの党や日本未来の党は検索はたくさんされたが比例区の得票は他党に比べ少なかったとの結果になりました。

次にSNS投稿数との比較ですが、こちらはなんと小選挙区の得票数結果と非常に高い関連性が見つかりました。

政党名のSNS投稿数と小選挙区結果との相関

2つのグラフが並んで表示されています。左のグラフは、SNS投稿数と得票数の相関を示し、右のグラフはSNS投稿数と議席数の相関を示しています。左のグラフは得票数(万)と投稿量(指数)の関係を散布図で表し、相関係数は0.982です。右のグラフは議席数と投稿量(指数)の分布を示し、相関係数は0.836です。これらは政党名のSNS投稿と選挙結果の関連性を分析したものです。

検索数と比例区には強い相関がありましたが、SNS投稿数はなんと小選挙区の得票数と非常に高い相関があることがわかりました。
自民党と民主党が大きく抜きん出ているため、多くの政党が左下に集中する形になりましたが、グラフからも、SNSでの投稿が多い政党はそのまま小選挙区でも得票しているという事実を見いだすことができます。

上記の結果より、「Yahoo!検索」における政党名検索数やSNS投稿数を調べることで、ある程度精度の高い選挙結果予測が可能になるかもしれない、という非常に興味深い結果となりました。 また上記以外の組み合わせについてはレポート詳細を見ていただければと思いますが、それぞれ面白い結果となっていますので、ぜひご覧ください。

注目度と候補者別の得票、当選について

さらに候補者別の調査も行いました。小選挙区候補者名の検索数、SNS投稿数をそれぞれ指数化して足し合わせたものを「注目度」として設定し、その指数と得票数や当落結果についての比較を行ってみました。

まずは全候補者の注目度分布をグラフ化したものと、注目度の数字を全体で三等分し上位からそれぞれ「Heavy層」「Moderate層」「Light層」(HML層)に分けたグラフです。

候補者の注目度分布

2012年12月4日から15日にかけてのYahoo!検索データとSNS投稿数をもとにした候補者の注目度分布グラフ。横軸に1,294名の候補者、縦軸に注目度を示し、一部の候補者に注目が集中していることが視覚化されている。最上位の候補者に称号が集中し、多くの候補者は0に近い数値を持っている。

候補者の注目度HML区分

グラフは、衆議院議員小選挙区候補者1,294名を注目度に基づいてHML層(Heavy, Moderate, Light)に分けたものです。全候補者のうち、上位2%の候補者が全体の注目度の3分の1を占めていることが示されています。

今回小選挙区では1,294名の立候補者がいましたが、注目度で集計すると、検索されたりSNSで頻繁に投稿されていた候補者名はごく一握りだったことがわかります。特に立候補者名の全検索数+SNS投稿数の1/3は上位の24名に偏っていたことはかなり注目すべき結果だと言えるでしょう。

さらに、HML層と小選挙区の当落状況をクロス集計してみました。

注目度HML別の当落状況構成

注目度HML別に小選挙区候補者1,294名の当落状況を示すグラフ。L層、M層、H層の各階層での大勝、勝ち、僅差で勝ち、僅差で負け、負けの割合が示されている。円グラフで各層の当選率も表示。

注目度が非常に高い候補者たちは大きく勝つか、僅差で負ける傾向があり、まったく得票がないということがほぼありませんでした。一方、M層においても大負けはほとんどないものの、僅差で明暗が分かれた候補者が激増しました。そしてL層では当選者そのものが少なくなっており、注目度に応じて得票率も減少する傾向にありました。

レポート詳細ではさらに以下のように小選挙区全候補者の注目度のすべてを掲載しております。

各候補者の注目度と当落状況

候補者の注目度と当落状況を示すグラフ。各候補者の注目度(検索数+SNS投稿数を合算)を指数化し、縦軸に注目度、横軸に候補者名を並べる。棒グラフで表示され、小選挙区と比例区の当落がアイコンで示される。注目度トップ50の候補者が表示されている。

当選・落選議員の検索頻出第2ワード

他の調査としては、当選・落選議員それぞれの注目度上位30人を抜き出し、各人の検索第2ワード上位20個を集計し出現数を調査しました。その結果が以下のグラフになります。

当選・落選議員の検索頻出第2ワード

当選・落選議員の検索頻出第2ワードを比較したグラフ。左に当選議員の検索ワード、右に落選議員の検索ワード、それらの差分が示されています。

この結果から、「街頭演説」や「選挙区」と一緒に検索される議員は当選している傾向がある一方、落選議員は「画像」や「動画」とともに検索される傾向があり、特徴がはっきりと分かれる結果となりました。

このほかにも詳細レポートではここで紹介しきれなかった調査レポートや「Yahoo!みんなの政治」のデータなども掲載しているので、ぜひともご覧いただければと思います。

今後とも「Yahoo!検索」および「Yahoo!ビッグデータ」ではYahoo! JAPANがもつ数々のビッグデータを利用して話題の事象についてレポートなどを報告していく予定ですので、今後ともよろしくお願いいたします

※12月28日 17:30 追加更新

安倍新内閣の閣僚注目度

さらなる追加分析として、12月26日に発足した第2次安倍晋三内閣の閣僚に関して12月26日~27日における注目度(検索数+SNS投稿数)を調査してみました。

安倍新内閣の閣僚注目度

グラフは、安倍新内閣の閣僚の注目度を示しており、検索数とSNS投稿数を合算した指数で表現しています。行政改革担当の稲田氏が検索数で1位、安倍総理がSNS投稿数で圧倒的な1位を記録しています。

SNS投稿数では安倍氏が圧倒的な投稿数を記録する一方、検索数では安倍氏よりも行政改革担当の稲田氏が上回るなど、おもしろい結果となりました。

レポート詳細

Yahoo! JAPAN ビッグデータ レポート(PDFファイル)

文・図/Yahoo! JAPANビッグデータレポートチーム

Page top