新型コロナの数値は予測可能か? ビッグデータで検証してみた

感染症・健康
新型コロナの数値をビッグデータで予測可能か検証したLINEヤフーのレポートのタイトル画像。シンプルなデザインで、背景は白、タイトル文字は黒色で大きく表示されています。

こんにちは、LINEヤフービッグデータレポートチームです。

最近の世の中の関心と言えば、猛暑やゲリラ豪雨、オリンピックにおいての日本人選手の活躍といったところが思いつきますが、実は忘れてならないのが「新型コロナウイルス」です。

2023年に5類に指定されたことで以前ほど関心度は薄れてしまったかもしれませんが、いまも重症化すれば恐ろしい病気であることは変わっていません。そして、その新型コロナウイルスが今、いわゆる第11波として猛威を振るっています。

以下の推移は、厚生労働省から発表されている2023年5月からの定点あたり報告数推移と全国の都道府県別定点当たり報告数です。

(図1)新型コロナの定点あたり報告数推移(7月29日週)

新型コロナの定点あたり報告数推移(7月29日週)

資料:厚生労働省
対象期間:2023年5月8週~2024年7月29日週まで

(図2)都道府県別の新型コロナ定点当たり報告数(7月29日週)

都道府県別の新型コロナ定点当たり報告数(7月29日週)

資料:厚生労働省
対象期間:7月29日週

厚生労働省によると、第31週(7月29日~8月4日)の定点あたり報告数は前週からさらに増加して13.29という数値となりました。過去の波形と比較しても高い数値にあることがわかります。
そして全国の数値を見てみると、先週よりも減少しつつありますが、九州地方が20近い数値を持つ県が多く特に激しく流行しています。
感染症の流行といえば皆さんはインフルエンザのほうが馴染みが深いかもしれませんが、インフルエンザがもっとも流行する時のピークはこの定点あたり報告数が40~50あたりとなりますので、今だ27.82という数値の佐賀県の流行がいかに多いかということがわかるかと思います。
一方で、東日本側、特に東北などではまだ一けた台の県もあり、日本全国の中でも流行の状況に差があることもわかります。

【ビッグデータからコロナ定点あたり報告数は予測はできるのか?】

ビッグデータレポートでは過去にインフルエンザの定点あたり報告数が、Yahoo!検索における一部の検索キーワードとの強い相関があることを発見し、そのデータを用いることで厚生労働省が発表する数値を事前に予測するというレポートを定期的に公開してきました。

そこで、まずコロナの動きと相関の高い検索キーワード(検索クエリ)がないかを分析してみました。すると、とても相関の高いキーワードがいくつか抽出することができました。
その中の一つ、「コロナ 猫にもうつる?」という検索キーワードの検索数推移とコロナ定点あたり報告数の推移を比較してみましょう。

(図3)コロナウイルスの定点当たり報告数推移と「コロナ 猫にもうつる?」の検索数推移比較

コロナウイルスの定点当たり報告数推移と「コロナ 猫にもうつる?」の検索数推移比較

資料:厚生労働省、Yahoo!検索
対象期間:2023年5月8週~2024年7月22日週まで

波形を比較してみると、厚生労働省が発表する数値とほとんど同じ動きをしていることがわかるかと思います。
このような、相関係数の高い検索キーワード群を用いることで、コロナでも同様の予測が可能になりそうだということが判明しました。

次に、過去に行ったインフルエンザの予測ロジックとコロナと関連度の高いワードを利用して、コロナの予測を行います。

(図4)コロナ定点あたり報告数の予測値(8月5日週)

コロナ定点あたり報告数の予測値(8月5日週)

資料:厚生労働省、Yahoo!検索
対象期間:2023年5月8週~2024年8月5日週まで

8月5日~8月11日週の予測値は10.66となり、7月29日週の厚生労働省から発表された13.29という値よりも下がるという予測値となりました。
しかし過去には実数値、予測値ともに減少を挟んで再び上に向かう展開もあったため、予測値が下がったからと言って、必ずしも終息に向かうかどうかはわかりませんので、今後も数値を注視していきたいと思います。

また、過去のインフルエンザ予想では全体の数値以外に、都道府県別の予測値も公開していました。その時のロジックを同様にコロナにも当てはめて、今後の都道府県別のコロナ報告数の予測を見てみたいと思います。

(図5)都道府県別のコロナ予測値(8月5日週)

都道府県別のコロナ定点あたり報告数の予測データを示す散布図。横軸は定点あたり報告数予測値、縦軸は先週からの伸び率を示し、各都道府県の位置を示しています。青森県と山形県が伸びを示し、佐賀県などがピーク越えを示唆しています。

資料:厚生労働省、Yahoo!検索
対象期間:2024年8月5日
※コロナのピーク傾向からインフルエンザ予測で利用したグリッド閾値を修正しています

都道府県別の数値を出してみたところ、予測値が先週よりも下がった都道府県が45、上がったところが2と、全国的にも減少傾向だということがわかりました。
特にいくつかの県では先週からの伸び率予測値が0.7をも下回っているところがあり、急激な数値の減少が見られる県も出てきています。
しかし、お盆休みといった人々の活量が増える時期を迎えており、このまま引き続き減少傾向が続くのかはしばらく様子を見る必要がありそうです。

以上、厚生労働省によって定点当たり報告数が毎週公開されるようになったことで、インフルエンザ同様予測値を集計できるようになりましたので、今後も検証を続けてより精度の高いデータを収集できるように努めてまいります。

LINEヤフービッグデータレポートはこれからも社会課題の解決に役立つデータ活用事例を提供してまいりますので、引き続きよろしくお願いいたします。

Page top