お客さまのビジネスに今すぐ役立つ、データに関する最新情報を定期的にお届けします
コロナの感染拡大による生活ニーズへの波及効果をビックデータで分析
- 事例・分析レポート
2020年突如始まった新型コロナウイルスの感染拡大。ヤフー・データソリューションでも保有するデータを中心に人々の移動距離やコロナに関するニーズや悩みの分析レポートを公開してきました。 コロナウイルスの感染がとりあげられるようになってから半年以上が経った今、第一波・第二波と呼ばれる感染拡大の流行を経験し、その中で蓄積されたビッグデータから人々のニーズの増減について今回は分析してみたいと思います。
【どのように分析するのか】
今回は全国の新規陽性者数(厚生労働省データ)と検索キーワードの日別検索数の推移データを用いて、相関をとる手法を用いました。
わかりやすい例で解説しますと、新型コロナの新規陽性者数(全国)の推移データとヤフーの検索キーワードの検索数推移で相関をとった時に、「PCR検査 精度」(r=0.889)や「コロナ 熱 何度」(r=0.919)といった検索キーワードは高い相関係数となり、波形も類似していることがわかります。
もちろん負の相関をとることもできます。つまり、新規陽性者数が増えると連動して検索が減る言葉の抽出です。
実際に負の相関が高いキーワードを抽出してみると、「ブックカバー」(r=-0.892)や「ヘアスタイル」(r=-0.858)といったものが抽出されました。これはまさに、感染者数が増えて外出自粛傾向となることによる影響を真っ先に受けそうなキーワードであることが推測できますね。
この分析手法を用いることで、新規陽性者数が増えた場合にどのようなニーズが連動して増え、また逆にどのようなニーズが連動して減少するのか、ということが見えるようなります。
ただ、新規陽性者数が増えてきた余波による影響、つまり、遅れてでてくる影響はこれだけでは把握することが出来ません。そのため、検索数推移を実際の日付より2週間後にずらした場合の相関をとり、高い相関(正・負それぞれ)があった検索キーワードに対してクラスタリングを行って、ニーズのグルーピングを行うという手法を用いてみました。
【新規感染者数の増加から約2週間後に影響が出てくるのは?】
まずは正相関となる検索キーワードを見てみましょう。
これはつまり、コロナの新規陽性者数が増え始めてから約2週間遅れで連動して増加するものはなにか、を調べる分析です。
一定数以上の検索が毎日行われているという条件を満たす全ての検索キーワードを対象に、新規陽性者数の推移から2週間後ろにずらした推移データとの相関係数を取得しました(7日間移動平均)
それらのキーワード群の中から、相関係数が高い順に上位数千キーワードを抜き出して、クラスタリングを実施したところ、以下のジャンルがあることがわかりました。
緑太字がジャンル名、ジャンル名下のワードが実際の検索キーワードです。いくつか例にとって、検索キーワードの推移波形を新規陽性者数(ともに7日間移動平均)の推移と重ねあわせてみると以下のような推移グラフとなります。
検索数の山のピークが新規陽性者数から半月ほどずれているのがわかります。つまり、これらのキーワードはコロナの感染拡大が起こってしばらくしてから遅れて増えていることがわかります。
【逆に減るものは何か】
一方、負の相関でも見てみましょう。つまり、コロナの新規陽性者数が増えると、約2週間遅れて減少していくものは何か、という分析になります。手法は先ほどと同様に行いクラスタリングしたところ、以下のようなジャンルが出現しました。
先ほどと同様に具体的な検索キーワードの推移波形を重ね合わせてみるとこのような感じになります。
こちらも、患者数の山のピークから約2週間後に谷のピークが来ています。つまり、患者数が増えれば増えるほど、遅れてニーズがなくなってくるものということがわかりますね。
【1ヵ月後の影響はわかるのか?】
同様の手法を使えばさらに先のことがわかるのでは......? ということで30日先までずらした検索数推移の正相関を見てみたところ、非常に興味深いキーワードがいくつも現れました。その中の一つを紹介すると
感染拡大が進めば進むほど、1ヵ月ほど遅れて中庭のある家の検索が増えてきます。こちらはもしかしたら、コロナにより家で過ごす時間が長くなり、中庭があるような家で仕事をしたり家族と過ごしたりしたいといったような要望の表れではないかなと考えました。疑似相関や因果のない相関の可能性も否定できませんが、このようなデータを調べていくことで、コロナに対する様々な社会の影響を明らかにできる可能性がありそうです。
ヤフー・データソリューションではヤフーが保有する様々なビッグデータを用いることで、このような社会全体を対象とした俯瞰的な影響把握といったような分析も実施しております。ご興味・関心をお持ちの方は是非お問い合わせください。
※ 今回公開したデータを含め、ヤフー・データソリューションは、お客さまのデータを統計データとしたうえでデータの可視化や分析結果をご提供するサービスであり、個人を識別できるデータ (パーソナルデータ) については、お客さまから新たに同意をいただかない限り外部に提供することはありません。
※本記事の内容は公開日時点の情報です。
お客さまのビジネスに今すぐ役立つ、データに関する最新情報を定期的にお届けします