新型コロナ陽性者数の推移に連動する検索キーワードとは?

感染症・健康
新型コロナ陽性者数の推移と連動する検索キーワードを探るレポートのタイトル画像。右下に医療関連のアイコンが描かれています。Yahoo! JAPANビッグデータレポートと記載されています。

※ヤフー株式会社のコーポレートブログに掲載した記事を再掲載しています。

こんにちは、Yahoo! JAPANビッグデータレポートチームです。

新型コロナウイルスの第1例目の感染者が報告されてから、約2年がたちました。その間、日本では幾度となく第〇波と呼ばれる感染者数の増減を経験してきました。
そこで今回は、ヤフー検索で検索されたキーワードと新型コロナウイルスの新規陽性者数(以下、新規陽性者数)の推移の相関から、新規陽性者の動きと連動するコロナ関連キーワードはどのようなものがあるのかを調べてみました。

手法は、全国の日別新規陽性者数の7日間移動平均と、検索キーワードの日別検索数の7日間移動平均との相関をとり、陽性者数が増えると検索数も連動して増えるキーワードを抽出しました。 さらに、検索キーワードの検索数推移を1週間前にずらして新規陽性者数と相関をとることで、陽性者数が増えるよりも先に増加傾向が見えるキーワードがないかも併せて抽出してみました。

新規陽性者数の推移と相関の高い検索キーワードとは

まずは、新規陽性者数の推移と高い相関にある検索キーワードとはいったいどういうものでしょうか? 2021年の1月1日~2021年9月30日までの期間で抽出を行ってみたところ、かなり多くのコロナに関係するキーワードが抽出されました。
特にその中から、相関係数の高いキーワードをいくつかピックアップして紹介したいと思います。

全国の新型コロナ陽性者数と「コロナになったら」というキーワードの検索数の推移を比較したグラフ。2021年1月1日から9月30日までのデータの7日間平均を使用し、相関係数は0.98。陽性者数と検索数が高い相関を示し、一致する増減パターンが見られます。

この散布図は、2021年1月1日から9月30日までの新型コロナウイルスの全国新規陽性者数と「コロナになったら」という検索キーワードの検索数の相関を示しています。7日間平均で、非常に高い相関を持つ様子がわかります。

資料:厚生労働省、ヤフー検索データ(指数化)ともに7日間平均
集計対象期間:2021年1月1日~2021年9月30日

新規陽性者数と「コロナになったら」というキーワードの検索数推移は、一目見てもわかるほどに推移が一致していることがわかります。相関係数もr=0.98ととても高い値となっており、また増減の割合傾向までもが似ていることまでわかります。
5月頭のあたりには乖離が見られますが、新規陽性者数のゴールデンウィーク(祝日)による増減影響によるものと考えられます。
散布図のほうは、7日間平均のデータを使用してはいますが、きれいな相関関係が見て取れます。なお、散布がつながっているように見える大きな繋がりは、近似線より下の繋がりが第5波の上昇期、上の繋がりが下降期となっています。

さらに相関係数が高かったほかの検索キーワードも見てみましょう。

この画像は、日本全国の新規陽性者数と関連する検索キーワードの推移を示すグラフです。4つの異なるキーワード「コロナ うつす期間」「コロナ 回復までの期間」「コロナ 自宅待機期間」「コロナ 何日で治る」の検索数が、新規陽性者数の推移とどのように一致するかを表示しています。すべてのグラフには相関係数r=0.99が示されており、高い相関を持つことがわかります。1月から9月までの期間を対象にしています。

資料:厚生労働省、ヤフー検索データ(指数化) ともに7日間平均
集計対象期間:2021年1月1日~2021年9月30日

どの検索キーワードも相関係数がr=0.98を超えており、これらの検索キーワードは新規陽精査者数の増減に合わせてほぼ連動して検索数が増減するキーワードであるということができそうです。 また、濃厚接触者に関する関連ワードも高い相関が出る傾向があります。

グラフは全国の新型コロナウイルス新規陽性者数(青線)と、検索キーワード「濃厚接触者 自宅待機」と「濃厚接触者 家族は」の検索数推移(赤線)を示しています。左グラフは「自宅待機」、右グラフは「家族は」の検索数で、両者ともに高い相関(r=0.97, 0.98)を持っており、陽性者数とほぼ同じパターンを示しています。

資料:厚生労働省、ヤフー検索データ(指数化) ともに7日間平均
集計対象期間:2021年1月1日~2021年9月30日

一般的な考え方として、新規陽性者数が増えると「コロナになったら」といったキーワードで検索する人が増えるという関係性は想像がしやすいですが、実際にデータとして比較してみることでこのようなほぼ完全相関に近い結果が得られたということはつまり、ヤフー上で行われる検索行動が人々の世の中の動きと関連しており、現在の新規陽性者発生状況の推定に使えることが見えてきました。

1週間前に増加する検索キーワードは存在するか?

これを踏まえ、次に相関をとるタイミングをずらしてみたいと思います。検索数の推移を実際より1週間早くずらして新規陽性者数の推移と相関をとることで、新規陽性者数が増える(または減る)1週間前に同じ動き方をする検索行動が存在するのかを調べてみました。

すると相関係数が高く新型コロナと関係があると考えられる検索キーワードがいくつか見つかりました。それらを傾向に分けていくつか紹介したいと思います。

まずは「PCR検査センター」との推移比較です。

2021年1月1日から9月30日までの全国新規陽性者数と「PCR検査センター」検索数の推移を比較したグラフ。検索数を1週間前にずらした結果、新規陽性者数に先行してピークが来る様子を示しており、相関係数はr=0.95です。

資料:厚生労働省、ヤフー検索データ(指数化) ともに7日間平均
集計対象期間:2021年1月1日~2021年9月30日

検索数を1週間前にずらして新規陽性者数の推移と比較した相関係数はr=0.95。推移グラフとの重ね合わせでも、新規陽性者数より手前にピークが来ていることがわかります。
検査をすることで陽性かどうかが判定され、その数字が公表されるという一連の流れを考えると「PCR検査センター」の検索数が公表される新規陽性者数よりも早く検索数が増えることは確かにありえるかもしれません。

また別のキーワード傾向も見てみましょう。こちらは体調に関するキーワードです。

全国新規陽性者数と「風邪 味覚がない」「高熱が出たらどうする」の検索数推移を比較するグラフ。1月から9月までのデータで、いずれの検索数も新規陽性者数に先行して増加する傾向です。風邪 味覚がないはr=0.95、高熱が出たらどうするはr=0.94の相関です。

これらの検索キーワードは新型コロナの症状として取り上げられるもので、新規陽性者数が増えるまえには、こういった体調の変化を感じて検索数が増える傾向があることがわかります。
これ以外にも「コロナ 発症までの期間」といった検索キーワードも1週間前にずらした場合に相関係数がもっとも高くなる傾向があり、やはり新規陽性者数が増える前の前兆として、初期症状や体調不良を感じたことによる検索が増える傾向にあるといえます。

「PCR検査センター」の今の検索数はどうなっているのか?

では気になる、今検索数がどうなっているのかを見てみましょう。11月14日現在の「PCR検査センター」の検索数は次の通りになっています。

グラフは「PCR検査センター」の検索数推移を2021年1月1日から11月14日まで示しています。検索数は5月と8月にピークを迎え、その後は減少する傾向が見られます。7日間平均で指数化したデータです。

資料:ヤフー検索データ(指数化)7日間平均
集計対象期間:2021年1月1日~2021年11月14日

11月14日までの状態ではありますが、減少傾向が引き続き続いているようにみえます。今後も再び新規陽性者数が大きく増えることがないことを願いたいです。

最後に、このデータ分析において注意しておきたい点として、この分析で得られた傾向が今後も常に同一かどうかがわからないという点です。コロナを取り巻く環境や状況は日に日に変わっており、それに伴い関連する言葉もまた変化していくことになります。それらを踏まえて結果を見ていただけると幸いです。

今後も、新型コロナに関するレポートをお届けする予定です。Yahoo! JAPANビッグデータレポートをよろしくお願いいたします。

文・図/Yahoo! JAPANビッグデータレポートチーム

Page top