2012年から定期的に公開されている「ビッグデータレポート」。これは、さまざまなサービスから生まれる膨大なデータやソーシャル上のトレンド情報などを分析・活用し、「データの持つ力と面白さ」をお伝えする目的で作成しているレポートです。
ビッグデータレポートが生まれた背景やデータを可視化する難しさなどを聞きました。
2007年入社。Yahoo!検索事業部の編集業務を行う傍ら2012年より、ビッグデータレポートチームの立ち上げメンバーとして、データ分析およびレポート作成に携わる。
「Yahoo!検索のキーワードランキングを見るのが大好きで、過去に運用していた検索スタッフブログで面白いキーワードの分析記事を発信していました。そのことが、現在のビッグデータレポートの執筆につながりました。できるだけ多くの方にデータの魅力をお伝えできるよう、わかりやすく書くことを一番意識しています。
データの分析に向いている人は、データそのものに興味を持てる人。そのデータがどのように生まれて、どういう定義でつくられているか、そこに興味が持てれば、自然とどのデータをどう分析したらよいのか発想の幅も広がると思います」
最初に公開したビッグデータレポートは、2012年12月16日に行われた「第46回衆議院議員総選挙」に関するレポートです。このレポートでは、総務省が公開している投票数、得票数、政党別、都道府県別の投票結果データと、「Yahoo!検索」や「Yahoo!検索(リアルタイム)」などのビッグデータを比較・分析・調査しました。
この選挙の1、2週間前、ビッグデータレポートの責任者である安宅が「今回の選挙の結果と、(当時の)ヤフーのデータを組み合わせることで何か関係性が見られないだろうか」と検討していたそうです。
私は当時、「Yahoo!検索スタッフブログ」で検索キーワードのランキングなどを使った分析記事を連載していました。そのため、検索データを分析できる人材としてこのレポートの作成に携わったことが、ビッグデータレポートに関わるようになったきっかけです。
このレポートでは、「選挙の得票数と検索量の間に関係性がある」という重要な発見がありました。
具体的には、「(投票所で)投票する」という行動で集められたビッグデータと、Yahoo!検索のアクションログで集まったビッグデータという、一見関係性がなさそうな二つのビッグデータの間に関係性があることがわかったのです。
つまり「ビッグデータを分析することで、世の中の消費者・生活者の行動や社会現象を把握できる可能性があるのでは」ということを見いだし、その後、インフルエンザ予測や日本の景気予測などの他のレポートを作成するきっかけにもなりました。
また、このレポートの反響が大きかったことも取り組みが継続された理由です。もし反響がなかったら、この1回だけで終わっていたかもしれませんね......。
現在、ビッグデータレポートの分析担当者は6名です。定例会議で「このような分析をしたら、もしかしたらこんな面白い結果がでるのではないか」とテーマを持ち寄り、検討しています。また、責任者の安宅の「今、社会的にこんな課題があって困っている人が多い。データから何かわかることはないだろうか?」という呼びかけがきっかけとなって作成することもあります。
レポートの完成までには、2週間から1カ月かかります。完成したレポートは、チーム内と責任者の安宅、広報担当者の確認を必ず行ってから公開しています。
また、ビッグデータレポートでは、ユーザーのみなさまの個人情報には一切触れていません。すべてのレポートで、個人情報が特定されることがないよう加工、フィルタ、情報のあいまい化をするなどの処理を行ったデータを使用しています。
これまで定期的に公開したレポートの中では、選挙予測やインフルエンザの予測レポートが毎回大きな反響を得ています。
また、たとえば、下の地図では、たとえタイトルが見えなかったとしても、なんとなく「東北地方は数値が高く、関西地方はあまり数値が高くない」何らかのデータを可視化したものだということがわかるのではないでしょうか。このように、地図を使うとデータの理解へのハードルがぐんと低くなります。
また、日本地図を使うことで、自分の立ち位置(どこの出身なのか、今どこに住んでいるのか)を置きやすく、自分ごととしてとらえやすくなります。分析は、何かと比較することで面白いと感じたり、発見が得られたりすることが多くあるからです。
私は10年以上、検索キーワードの分析に関わっていますが、視点や分析手法を変えることで毎回新しい発見があるので、まだまだ分析できることは尽きないです。引き続き、検索キーワードに関連したレポートを発信していきたいと思っています。
また、データ量が増えれば増えるほど、短いテキストで伝えたり一枚画像で見せたりすることは難しくなります。今後は、分析結果の要点をよりわかりやすく見せることにも取り組んでいきたいですね。
データは、量や種類があればあるほどいろいろな分析ができ、さらに異なるデータ同士をクロスさせることで、より精度が上がる傾向にあるため、正確な結果を得やすくなります。LINEヤフーとして統合したことで、より多くのデータを扱えるようになるため、それらをクロスさせていくことで、これまではわからなかったことが、今以上にわかる時代になると思っています。
これからも、世の中の課題についてデータを元に検証し、ビッグデータレポートを通じてユーザーのみなさまに「データが持つ力や面白さ」をお伝えしていきます。
※ヤフー株式会社のコーポレートブログに掲載した記事を一部修正し再掲載しています。