導入事例:慶應義塾大学医学部
導入事例
慶應義塾大学医学部
細かい粒度で深い分析を実現
保健政策研究における人流データの活用
慶應義塾大学医学部では、保健政策の研究においてヤフーの位置情報統計データを活用されています。
今回、ヤフー・データソリューション DS.ANALYSIS のご利用事例として慶應義塾大学医学部特任准教授の野村先生にお話を伺いました。
慶應義塾大学 医学部 医療政策・管理学教室 特任教授 野村 周平 様
- ご研究のお立場や背景を教えてください
慶應義塾大学医学部、医療政策・管理学教室の特任准教授を務めています。まず、どのようなデータがどのような形式であるかを拝見せていただいた上で、私のほうで研究の肝となる仮説や分析の方針をデザインし、その上で実際にデータを分析し、その結果を政府にインプットしながら、学術論文としても査読付き国際雑誌に載せるという、一連の科学的検証プロセスをやらせていただきました。
大きく分けると、政府へのインプットと、科学者として広く研究結果を公開し、社会に還元していくという 2 つの取り組みに注力しました。
- 実際の研究はどのようにスタートしたのですか?
2021年当時、この"人流"という人の動きに関するデータは、内閣官房のウェブサイトで幅広くデータは一般に公表されていました。一方で、人流データの多面性を考えると、もっと別な切り口からデータを眺めることも可能と考えていました。もちろん、公表データの粒度は、データの性質上プライバシーの問題とも関係してきますし、あるいはデータの見せ方やビジュアル化のデザインは、どんなメッセージ性をデータに持たせたいかに大きく依存します。
例えば、ウェブ公表されていたケースは、主要な35の駅や繁華街を中心に、そのエリアを通過する人の数が、コロナ前と比較して増えているのか減っているのかを、パーセンテージで表記するなどされていました。一方で、当時私は緊急事態宣言やまん防(まん延防止措置)が出されて、その効果を人流という指標で把握したいと考えていました。
宣言が出されて行動が抑制された結果、感染者数がおそらく下がる、その間にいろいろなプロセスが発生する、つまり複雑な感染のメカニズムがあるわけですが、そんな中で緊急事態宣言の効果を単純に計れるとしたら、やはり人流という指標がまずあると思います。その値を政府の施策のエビデンスとして、緊急事態宣言等が的確に機能しているかどうかを評価するというのは、重要な課題の1つでした。
ヤフーの位置情報の特徴
- ヤフーの位置情報をご覧になられていかがでしたか?
実際に人流データを見せていただくと、やはりヤフーさんは非常に詳細にデータを収集されていると分かりました。特に、年齢別のデータが非常に重要でした。なぜかというと、当時いろいろな不確かな情報が出回っていました。例えば「外出を自粛しないのは高齢者」というような、必ずしも正確なデータに基づかず、社会の分断を招きうるようなさまざまな情報が出回っていた中で、いったい何が真実なのかということをしっかり見定めるのは、重要な検証対象でした。
私たちが論文として発表した 1 編は、その問いに対し、一つの、あくまで一つの回答を提示するものです。年齢別に、時間帯も分けていますが、コロナ前の 2020年1月中旬の7日間平均をベースラインとして、コロナ以降どの程度の人流の増減が認められたのかを2021年3月まで、上記の35エリアを毎日単位で追っていきました。
あくまで「ヤフーさんのデータによると」、「観測している地点では」というデータの限界をしっかり意識した上で解釈が求められますが、高齢者は人流の変化をコロナ前から追って見てみると、特にコロナ前レベルに戻っている(外出している)ということはほとんどの観測エリアでは認められず、最初の緊急事態宣言、つまり2020年 4月ごろから低い人流レベルを保たれていました。一方で注目すべきは、若い世代ほど人流が、最初の緊急事態宣言が終わってから徐々に増加し、観測エリアによってはベースラインに近いレベルに戻りつつあることがわかりました。
ここで、非常に注意しなければならないのは、その結果の解釈です。例えば、若者の人流レベルがベースラインに戻ることは、決して若者が緊急事態宣言等に無頓着であることを意味しません。人流データを扱う研究で非常に重要になるのが、その背景や文脈を丁寧に考察することだと思います。例えば今回のケースでは、在宅ではなく出社が必要な仕事や、外回りの営業職や、通勤、対面、出張の多い職種など、働き方の世代差が存在し、それが反映されている可能性があります。学生のアルバイト先で多いとされる飲食店などは、対面接客はどうしても避けられない場合はほとんどでしょう。
詳細な人流データは、施策の効果の検証に役立つとともに、こういったコロナ禍の新しい生活様式、あるいは格差などの課題に視野を広げる考察を可能にしてくれたヤフーさんのデータは非常に大きな価値があると思っております。
- 今までは人流データを使っていく研究というのは、これまでおそらく疫学上でもいろいろな形でやられていたと思うのですが、ヤフーのデータは少しこれまでと違ったといったことなど、ありましたでしょうか?
ヤフーさんのデータは年代別の他、細かな時間軸や小地域で捉えられるという点が非常に重要な特徴でした。人流データはさまざまありますが、当初は多くが 1日単位で国、あるいは地域の全人口をひっくるめたデータになっており、朝昼晩といった時間単位、あるいは駅や繁華街といった小地域レベルで細かく人の活動性を見ることができませんでした。もちろん前者のアドバンテージもとても大きく、人流情報が全部、つまり国や地域網羅的に公開されていることで、例えば日本の場合、すべての都道府県単位のデータが公表されていることで、いろいろな比較研究を可能としていました。例えば感染症モデリングの中で、人流減がはたして感染者数に影響しているのかどうかの研究に使われたり、あるいはイギリスなどですとロックダウンの人流に与えた効果検証を地方レベルで(日本で言うところの都道府県レベルで)しっかり評価するのに使われておりました。
一方で、感染状況や社会環境の異なる国内の小地域で、さらに詳細に実態を見ていこうとすると、やはり粒度の小さいデータも必要になります。夜間の人流は増えているのか、日中はどうなのか、夕方以降は、といったものもしっかり見て把握することも大切です。例えば緊急事態宣言では結果的に夜の時間帯の制限が非常に大きくなりました。ヤフーさんのデータで見てみますと、実際にその時間帯の人流はどの世代でもかなり下がっていたことが伺えます。
分析グラフ(東京駅での年代別人流推移)
日本に限らずですが、人口レベルの一律のロックダウンというのは、やはり国民的には受け入れがたいところが非常にあったと思います。都道府県全域の緊急事態宣言においても、感染者が多く出ていない地域や場所、感染リスクの少ない時間帯などが実際は存在するであろう中、地域全体で同じように、一様に何かしらの制限を設けることに対する反発はやはり大きかったと思います。将来的に、ヤフーさんのような詳細なデータを活用することで、より個別具体的で、ピンポイントで効果的な施策が可能になる余地はたいへん大きいと思います。
- 今後、ビッグデータの活用といったところで、実際の研究の現場にいる野村先生として、こういうことがもっとできたらいいとか、こういうことをやっていきたい、といったことはありますか?
まずはより細かな粒度のデータが一般に公表されるというのは、非常に重要な点と思っております。例えば、論文の査読のプロセスの中で、「もっとこうしたデータは公表できないものか」という指摘をいただくことがあります。私のような疫学、生物統計学者に限らず、例えば感染症モデリングや政策分析、他さまざまな社会科学系の研究をされる先生方も、おそらく詳細なデータの公開を求めていると思います。
細かい粒度でないにしろ、プライバシーに最大限配慮した上で、データがCSV等で自由に誰しもがダウンロードでき、さまざまな用途に活用できる状況がベストと考えています。
- 誰もが同じレベルで、同じデータだからこそ検証しあえるということですよね。
はい。これはもちろんヤフーさんに限らずという話ではありますが、人流データにはいろいろなバイアスが入ってしまいます。今回の件ですと、ヤフーさんのアプリのユーザーに限ったデータというバイアスもあります。やはり人流データを収集している組織によって母集団に違いは出てくるので、複数のデータを見ながら真実を考察するというのが、科学的姿勢としては非常に重要になってきます。ですので、ヤフーさんのデータ、さらには複数のデータを使い比較的に検証をされた分析が行われ、多くの人がそうした複数のデータを見ながら考えることができる状況がベストと思います。
加えると、こうしたデータがパンデミック期間中に限って収集されるということではなくて、平時から継続的に収集されるシステムが非常に重要と思います。やはり、1年間を通じて人流は変化するので、あくまで仮説ですが、例えばある地域では冬のほうが人の活動性が高く、夏のほうが小さい、そういった季節的な変動を考慮する上で、 ある時点のちょうど1年前のベースラインデータがあることが好ましいです。公衆衛生的な危機が仮に将来起きた際に、比較対象として昔はどうだったか、と平時の状況をきちんとさかのぼられることが大事なのです。
また、直近のデータ需要として私が思っているのは、おそらく日本や世界の多くで、新しい生活スタイルが定着していく中で、どういった世代にどのようなコロナ前との変化があり、それがニューノーマルとして受け入れられていくのかが、今後大きな研究分野になってくると思います。
生活スタイル全般として、人流に限らず食生活もそうですし、運動もそうですし、医療のかかり方についても、ありとあらゆる健康に関連するものがコロナ前と比較してどう変わり、私たちはどの時点のレベルをこれから平時と考えていくのか、社会全体で考えるべき大切な議題だと思います。人流データは、その上で、社会活動の一つのプロキシとして、重要な指標になってくるでしょう。例えば高齢者の人流が下がりっぱなしであることを示すヤフーさんのデータは、高齢者の運動問題を主要な政策課題にあげるための大切なエビデンスになります。
- 今後どういったデータを取り扱えるようになるとよいでしょうか?
仮に一般にヤフーさんのデータがある粒度で一般公表されたとして、都心、あるいは農村地域ですとか、あるいは繁華街・ビル街・オフィス街・公園ですとか、エリアカテゴリーのタグ付けがされているデータが含まれると、分析の上で非常に有益だと思います。というのも、おそらく住宅街の場合、自粛に伴い人流はコロナ前よりはある程度高くなっていると思います。同じように、どういったエリアカテゴリーの人流が減っているのか、増えているのかを評価することは、例えば緊急事態宣言下で人はどういう生活スタイルに変わり、宣言の意図と反してどこに人は集まりがちになるのかなど、具体的な生活様式の変化を捉え、施策の副次的な効果まで評価することが可能になります。
- 私たちヤフーは位置情報をベースで持っているので、あとは地図上でどう定義するのか、ということですね。
特にパンデミック初期では、歓楽街などの特定のエリア、飲食店などの特定の業種を初め、一部のグループが批判の矢面に立ち、制限の的になりがちでした。上の世代別の人流の例にしかり、ひょっとしたらそうした批判の多くが、根拠は不確であるかもしれません。位置情報をきちんと分析し、実際の感染状況等と比べながら評価を行うことで、感染拡大防止に限らず、風評被害を軽減し、社会の分断を防ぐのにも、人流データは大きく役立つポテンシャルがあると思います。
- 最後に、今後の研究の方向性について、お願いします。
今後は、コロナの間接的な健康影響がどの程度発生しているのかを評価しようと考えています。コロナによって亡くなる数が増えた、減ったの議論は多くでなされる中で、間接的に、例えば外来患者数が減った、新規入院者数が減った、病院の入院日数が減ったという医療アクセスに関連するデータを私たちは継続的に出し続けていますが、その結果として、例えば特定の疾患系の死者が増えている、罹患率が増えている、などが既に起きているかもしれません。そういった間接的な影響も調べていく中で、加えて、どういった要因が、医療アクセスの課題以外にも関連するファクターなのかというのも、これから丁寧に調べていかないといけないと思います。
医療的なインプットなのか、例えば医師数、看護師の数、病床数といった話なのか、あるいは新しい生活スタイルの変化がそれに寄与しているかもしれません。総合的にパンデミックの間接的な影響とそのメカニズムを調べていく中で、生活スタイルの変化という要因を考えたときに、人流データが一つキモになってくると思います。運動量のデータはあまりないのです。タイムリーにかつ継時的に収集されるデータは世界的にほとんどありません。一方で、タイムリーに収集されているデータの一例は、コロナ禍ではコロナワクチンの接種状況や、そして人流です。
- 私たちのデータをこうやって使っていただくことで人流データをもっと社会に役立てていただける要素があるということを感じられて非常に嬉しい限りです。
- どうもありがとうございました!