今冬のインフルエンザはビッグデータでも予測困難!?
さまざまな感染症の患者数が今年は激減中

ビッグデータ
今冬のインフルエンザがビッグデータでも予測が困難であることを示す画像。黒文字のテキストと、右下にシンプルなクリップボードのイラストが描かれています。「Yahoo! JAPAN ビッグデータレポート」のロゴが左下にあります。

こんにちは、「Yahoo! JAPANビッグデータレポート」チームです。

ビッグデータレポートでは2014年よりインフルエンザの定点患者報告数を予測するというレポートを毎年報告しています。

ビッグデータ分析でみるインフルエンザ感染状況

また、インフルエンザだけではなくノロウイルスや手足口病、水ぼうそうなどもヤフーのビッグデータで観測可能なのでは、というレポートを過去に公開しており、定期的に実際の感染者数のデータを確認しています。

インフルエンザだけじゃない⁉ ビッグデータと流行性感染症との関係

そのレポート内でも触れていますが、感染者数をデータからとらえるうえで重要になってくるのが周期性です。毎年、特定の時期に感染が拡大してくると把握できていれば、その周期リズムと連動する関連検索キーワードを把握することで、感染者数の推測につなげることが可能となるからです。

しかし2020年の新型コロナ感染拡大後、国立感染症研究所のIDWR速報データにて公開されているさまざまな感染症の定点当たりの患者報告数(感染者数)にかなり特徴的な変化が起きています。今回はそれに関するお話をご紹介したいと思います。

さまざまな感染症の患者数が激減中

実は、周期性を持つ感染症が例年と明らかに違う傾向にあるのは、すでに検索キーワードの変化からも明らかでした。
例えばプール熱のこの3年間の検索数推移変化は、例年と比較してあきらかに少ない検索数となっていました。

「プール熱」の検索数推移を示すグラフ。2018年から2020年までの週ごとのデータを比較し、2020年は例年に比べて検索数が大幅に減少していることが視覚的に確認できる。特に夏季のピーク時の減少が顕著で、感染者数の減少と関連している可能性が示唆される。
資料:Yahoo!検索 集計対象期間:2018年第1週~2020年第33週まで

過去の分析レポートからも鑑みて、検索数が少ないということは実際の感染者数も少なくなっている可能性が高いため、国立感染症研究所のデータを見てみたところ、今年はさまざまな感染症の感染者数が減っていました。

咽頭結膜熱(プール熱)の過去10年間の週ごとの報告数を示す折れ線グラフ。2020年の数値は赤色で、他の年と比較して低いことがわかる。特に夏季の感染者数が少なく、例年に比べて感染が抑制されていることが視覚的に示されている。

手足口病の過去10年間の週ごとの報告数を示す折れ線グラフ。2020年の数値は赤色で、他の年と比較して低いことがわかる。特に夏季の感染者数が少なく、例年に比べて感染が抑制されていることが視覚的に示されている。

ヘルパンギーナの過去10年間の週ごとの報告数を示す折れ線グラフ。2020年の数値は赤色で、他の年と比較して低いことがわかる。例年に比べて感染が抑制されていることが視覚的に示されている。
資料:国立感染症研究所 対象期間:2010年第1週より2020年第32週まで

通常、毎年夏に拡大する上記のような感染症は、今年は軒並み大幅に感染者数が減っていることがわかります。
また、夏だけが流行シーズンでない感染症もすでに例年と異なる推移を見せています。

A群溶血性レンサ球菌咽頭炎の過去10年間の週ごとの報告数を示す折れ線グラフ。2020年の数値は赤色で、他の年と比較して低いことがわかる。冬季の感染者数が減少し、例年に比べて感染が抑制されていることが視覚的に示されている。

RSウイルスの過去10年間の週ごとの報告数を示す折れ線グラフ。2020年の数値は赤色で、他の年と比較して低いことがわかる。例年に比べて感染が抑制されていることが視覚的に示されている。

感染性胃腸炎の過去10年間の週ごとの報告数を示す折れ線グラフ。2020年の数値は赤色で、他の年と比較して低いことがわかる。例年に比べて感染が抑制されていることが視覚的に示されている。
資料:国立感染症研究所 対象期間:2010年第1週より2020年第32週まで

推移を見てもわかる通り、どの感染症も過去10年において最も低いレベルの感染者数推移を描いています。断言はできませんが、外出抑制も含め、コロナ禍において徹底期に行われている感染予防策や、衛生に関する意識の変化がこのような影響を与えていると考えられます。

今冬のインフルエンザ予測は⁉

そして、やはり気になるのが今冬のインフルエンザです。
インフルエンザは秋から冬にかけて感染する病気のイメージが強いですが、実は夏でも感染することがあり、1年を通して定点あたりの患者報告数が0になることはこの10年で1度もありませんでした。しかし、今年はなんと0という数字が出ています。

インフルエンザの定点患者報告数を示す表。2010年から2020年までの週ごとのデータを比較し、2020年の数値が0であることが視覚的に確認できる。これまでにない低い数値が示され、感染者数の大幅な減少が確認されている。
資料:国立感染症研究所 対象期間:2010年第1週より2020年第32週まで

ほかの感染症にも言えることですが、インフルエンザの検査に対してリソースを避けないなどの理由もありそうですが、0というのはかなり特徴的な数値です。

しかしこの変化は何も急に始まったわけではありません。インフルエンザの感染者数推移を2010年から推移を見てみましょう。

インフルエンザの過去10年間の週ごとの報告数を示す折れ線グラフ。2020年の数値は赤色で、他の年と比較して低いことがわかる。例年に比べて感染が抑制されていることが視覚的に示されている。
資料:国立感染症研究所 対象期間:2010年第1週より2020年第32週まで

冬の1~3月通常はインフルエンザが大流行するシーズンですが、今年は明らかに低い数値となっていました。年始の段階ですでに中国での新型コロナのニュースが流れていたこともあり、それらが影響を及ぼした可能性も考えられます。
(2010年の冬の数値が低く見えるのは、2009年の新型インフルエンザが秋の段階で大流行したため)
どんな病気でも感染者数が減るというのはとても良いことです。
ただし、初めにも触れましたが、数値を予測する際に周期性というデータは強力な要因となるため、インフルエンザにとどまらずあらゆる感染症がこれまでにない推移傾向となっていることは、分析の面では複雑になってきています。

感染症以外はどうなのか?

新型コロナが影響を与えているのはもちろん感染症だけではありません。例えば「骨折」というキーワード。外出やイベントの自粛、学校の休校などもあったためか昨年よりも検索数が減っています。

「骨折」の検索数推移を示すグラフ。2018年から2020年までの週ごとのデータを比較し、2020年は例年に比べて検索数が減少していることが視覚的に確認できる。外出自粛の影響が示唆される。
資料:Yahoo!検索 集計対象期間:2018年第1週~2020年第33週まで

このように新型コロナによる自粛が影響していると思われるものあれば、新型コロナの陽性者数推移と連動して体調に影響を及ぼしていると考えられるものもあります。
例えば、頭痛を含む検索キーワードを調べてみると、全国の日別陽性者数の推移とその推移から2週間後の「肩こり 頭痛」の(ともに7日間平均)相関係数は0.881と高い相関があります。つまり、感染者数が増えてくると、2週間後には肩こりによる頭痛を訴える人が増える、という可能性が見られます。

全国の感染者数推移と「肩こり 頭痛」の検索数推移を示すグラフ。7日間平均で示され、感染者数の増加に伴い、肩こりや頭痛の検索数が増加する相関関係が視覚的に確認できる。
資料:厚生労働省、Yahoo!検索 集計対象期間:2020年2月16日~2020年8月12日まで
7日間移動平均および検索データは2週間ずらして重ね合わせを行っている

「肩こり 頭痛」の検索数推移を示すグラフ。2018年から2020年までの週ごとのデータを比較し、2020年は例年に比べて検索数が増加していることが視覚的に確認できる。コロナ禍によるライフスタイルの変化が影響している可能性が示唆される。
資料:Yahoo!検索 集計対象期間:2018年第1週~2020年第33週まで

頭痛を含んだほかの検索キーワードでも同様の動きがあり、明確な理由は不明ですが、ストレスやマスクを着用する機会が増えたこと、テレワークの増加などコロナによって変化したライフスタイルの影響にて頭痛が増えている可能性も考えられます。コロナに関するさまざまなデータと検索キーワードの関連性をもっと調べていくと、心や体に与える影響などを把握するきっかけになるかもしれません。

また、コロナ感染拡大の時に増加する検索キーワードとして、「〇〇 治し方」といった治療系のキーワードが増加する傾向にあります。コロナが心配でちょっとした症状では病院に行かず自宅で対処しようとしている人が増えている可能性がありそうですが、過度な我慢はせず、体調に異変を感じたら受診してください。

引き続きYahoo! JAPANビッグデータレポートではこれからも世の中の課題についてデータを元に検証し、データが持つ可能性や力強さをお伝えしてまいります。今後ともビッグデータレポートをよろしくお願いいたします。

Page top