COVID-19パンデミックの説明要因
本記事の内容は、その後、論文として2020年9月にPLOS ONE誌に掲載されました。
https://journals.plos.org/plosone/article/authors?id=10.1371/journal.pone.0239385
私の研究室は、生物多様性保全に焦点を当て、マクロ生態学や生物地理学の研究を行っています。新型コロナウイルス(COVID-19)のような新興感染症は、元をたどれば、熱帯の自然破壊や野生生物の管理、つまり生物多様性の保全利用の問題に行き着きます。ですので、私たちの研究チームでも、COVID-19問題を生態学研究者として考えてみることにしました。
4月12日までのデータを分析して、COVID-19感染拡大の主要因(ドライバー)を明らかにした論文を、プレプリントとしてmedRxivに公開しました。
https://www.medrxiv.org/content/10.1101/2020.04.20.20072157v1
これは以前の記事でお知らせした予報が元になっています。
https://note.com/thinknature/n/na0e792d5b4e5
この記事では、medRxivのプレプリントの内容(COVID-19感染者数の時空間拡大様式の分析結果)を紹介します。
COVID-19感染者数の時空間データ
2019年12月の中国・武漢から始まったCOVID-19感染者数の時系列データを、世界スケールで整備しました。前記事では4303地域のデータでしたが、今回は時空間パターンの分析のために、1055箇所の国・地域で集約して感染者数データを整備しました。以下の動画が、2020年1月以来の感染者数(人口100万人当り)の世界的な拡大パターンを示しています。
https://www.youtube.com/watch?v=ZIDMtbek-48
また、感染者数がどのような気候帯やバイオームで発生しているかを観るために、横軸を各地域の年平均気温、縦軸を年平均降水量にしたグラフも作成しました。グラフ中にはバイオームタイプが表示されています。
動画内のグラフ中の矢印は、COVID-19が発生した武漢の気候の位置を示しています。動画を見ると、感染の初期は様々な気候帯で感染者が発生しますが、感染爆発は、発生源の武漢と同じような気候帯の、温帯夏雨気候やステップ気候で主に生じていることがわかります。
https://www.youtube.com/watch?v=KlnpUY51D3k
COVID-19感染拡大に関係しそうな説明因子データ
感染者数の日変化データの加えて、それを説明する要因として、1055地域の気候条件、人口密度、経済水準、人の移動などのデータも整備しました。また、COVID-19感染には、BCG接種やマラリアの予防対応(抗マラリア薬の服用)も関係しているという「宿主集団の感受性仮説」もあるので、地域ごとのBCG接種やマラリア感染に関わるデータも併せて整備しました。以下が、データのリストです(冒頭の英文字は変数のラベルを表します)。
country: 国名
region: 地域名
lon: 州都または県都、首都の経度
lat: 州都または県都、首都の緯度
prec: 降水量1_3月平均
temp: 気温1_3月平均
area: 地域面積
pop: 地域人口
GDP: 国内総生産(同じ国の場合、全地域に同じ値を与えた)
GDPper: 国民一人当たりの国内総生産(同じ国の場合、全地域に同じ値を与えた)
Visitor: 人口に対する海外からの観光・ビジネス客数(インバウンド数/年)の割合
Mararia: 人口に対するマラリア感染者数(/年)の割合
BCG_year: 国ごとのBCG接種年数(接種を開始してからの年数。ただし一部の国は開始から停止までの年数)
BCG_type: 現在の国としてのBGC接種の状況(全員接種=3、一部接種=2、過去に接種=1、歴史を通じて未接種=0)
BCG_rate: 国ごとの1980年以後の1歳未満接種率の平均値
MultipleBCG: 国ごとの接種を受ける回数
TB: 国ごとの100万人あたりの結核発症者数
Age65: 国・地域の65歳以上人口割合
Test: 各国・地域の感染者の検査数
First cases:各地の感染開始時
Cases: 1月1日以降の各日の感染者数(時系列データ)
COVID-19感染者数の時系列変化のモデリング
以上の環境データを説明変数にして、COVID-19感染者数(100万人当たりの感染者数の対数値)を応答変数にした重回帰分析、および機械学習に基づくランダムフォレストによる説明要因の重要性の評価分析を行いました。これにより、どのような要因が、COVID-19パンデミックと関係しているのか明らかになりました。
COVID-19感染拡大が、2020年の1月、2月、3月、4月と進行するにともない、いくつかの説明要因が、有意に作用してきます。
以下のグラフは、横軸に説明変数のラベル、縦軸には標準偏回帰係数を示しています(グラフ中の黒丸が、統計的に有意なことを示しています)。また、各グラフの上の棒グラフパネルは、それぞれの説明変数の説明力(R2値)を示しています。青色は気候に関する変数、緑色はインバウンド数やGDPなどの変数、赤色は集団の感染感受性に関する変数です。
2月くらいから、BCGやマラリア感染率や高齢者率など、COVID-19感染の感受性に関わる変数や、インバウンド数など人の移動に関する変数の効果が卓越して作用してきます。
さらに、一連の説明変数の効果を詳細に観るため、日毎の時系列パターンを検証しました。
以下は、日付を横軸にして、回帰モデルの標準偏回帰係数の日変化を縦軸に表したグラフです。塗りつぶされた●は統計的に有意なことを示します。1月から日にちが経過すると、気温や降水量、インバウンド数やGDP、BCG効果やマラリア感染率などが有意に作用する(◯から●に変化している)ことが明らかです。
特に、インバウンド数、BCG効果、マラリア感染率が、COVID-19感染者数が、感染者数の拡大や抑制に関係していることがわかります。
つまり、海外からの人の流入が多い地域はCOVID-19感染者数が多く、BCG接種されている地域、マラリア感染者の多い地域ほど、COVID-19感染数が低く抑えられています。しかし、BCG効果は、4月以降、急激に弱まっていく傾向があります(理由は後述)。
また、感染開始日からの時間の効果が、日数が経過するに伴って低下しています。感染開始初期は時間経過とともに感染者数が増加するため、結果として、時間の効果が卓越します。しかし、時間が経過すると、上述したような環境変数に相関して感染が爆発する地域が発生するため、感染開始からの時間の効果が相対的に弱まります。また、封じ込めや抑え込み対策で、感染を制御した影響もあります。なお、感染制御策の実行時期(行動制限の発令日)の効果も検証したのですが、今回のモデル分析では、クリアに検出することができなかったので、制御策に関しては、論文で言及しませんでした。今回のような単純な回帰分析では、世界規模の対策効果の定量は難しいのでしょう。
また、機械学習に基づくランダムフォレストによるモデリングの結果も、ほぼ同じでした。以下のグラフで示したように、気候(青色)、インバウンド数やGDP(緑色)、BCG効果・マラリア感染率・高齢者率(赤色)などの相対的重要度が大きいです。
さらに、COVID-19感染確認の検査数の国・地域の違いを考慮(コントロール)しても、結果は、ほぼ同じでした。以下のグラフで示したように、気候、インバウンド数、BCG効果などが有意に効いています。
COVID-19感染拡大のドライバー
一連の分析は、COVID-19感染者数と、様々な環境変数の相関関係を観ているに過ぎません。環境変数とCOVID-19感染者数の因果関係は依然として不明です。しかし、以上の相関関係を、慎重に解釈することは可能かもしれません。
まず、COVID-19の世界的な感染拡大は、ウイルスの気候適地(ニッチ)が関係していると考えられます。モデル分析の結果からは、COVID-19のニッチは、低温で降水量が豊かな地域です。実際、冒頭で紹介したCOVID-19が発生している動画では、発生源の武漢と同じような気候帯(温帯夏雨気候やステップ気候)で、感染を爆発させているように見えます。
しかし、これから夏に向けて季節が変化していくので、それに対応したCOVID-19感染拡大を注視する必要があるでしょう。COVID-19の気候ニッチに関しては、さらなる検証が不可欠です。
また、COVID-19の感染拡大は、宿主である人の国際的な移動に関係しているようです。2月下旬からインバウンド効果が顕著になるので、このパンデミックには、国境・地域をまたいだ人の移動がドライバーとして関わったことは、確度が高いと考えます。
さらに、興味深い点として、COVID-19感染者数が、集団の感受性で地域的に抑制されている可能性があることです。今回の分析では、マラリア感染者数が抗マラリア薬の使用量と相関してことを仮定して、マラリア感染者数を説明変数に組み込みました。今後、様々な抗マラリア薬の地域的な使用傾向をデータ化して分析すれば、COVID-19に関する抗マラリア薬の効果を検証できるかもしれません。
BCG効果も一貫して、COVID-19感染者数を抑えている傾向がありました。しかし、パンデミックが進行した4月になると、BCG効果が急激に弱まる傾向があります。これは、4月になってから、BCG接種を続けている国の一部(例えば日本、ロシア、トルコ、ブラジル)で、感染者が急増していることが原因です。したがって、BCG接種の効果については、未だ明確でないと考えます(BCG接種の効果を過信していはいけない)。いずれにしても、地域的な感受性による感染抑制効果が、今後も作用し続けるかどうかは、継続した分析が不可欠です。
COVID-19感染拡大のローカルな要因
最後に、回帰モデルで予測された感染者数(予測値)と、実際の感染者数(観測値)の差、すなわち残差(residual)を検証してみました。
COVID-19感染者数の世界的な拡大傾向は、気候・人の移動・地域集団の感受性などマクロな要因で説明できますが、一方、各国・地域では、局所的なクラスター感染が発生したり、感染の封じ込めや抑制の対策が実施されています。
したがって、マクロな要因で予測した感染者数と実際の感染者数のズレ(=モデルの残差)は、ローカルな感染パターンや制御対策の効果を観ることにも利用できるかもしれません。
以下の地図は、モデル残差がプラス(赤色)の地域、モデル残差がマイナス(青色)の地域の分布を示しています。赤色の地域ほど、マクロな要因で予測される以上に、ローカルな要因で感染者数が多くなっていることを示唆します。一方、青色の地域ほど、ローカルな要因で感染者数が少なくなっていることを示唆します。
日本の都心地域、東南アジアや南米やアフリカの一部の国は、赤色の傾向があります。これは、ローカルなクラスター感染で、マクロな要因で予想される以上の感染者の発生数になっていることを示していると推論できます。一方、アフリカなどに青色地域(=マクロな要因で予想されるよりも少ない感染者数)が目立ちます。これは、COVID-19感染拡大が比較的最近で、感染者数の分布が未だに動的で非定常だからと考えられます。
パンデミックは決定論的に発生する
生物分布データのモデリングをしてる経験からすると、COVID-19の感染者数分布モデルの説明力には驚きました。
以下は、COVID-19の感染者数の回帰モデルの説明力(調節済R2値)の時系列変化です。世界的に感染拡大した3月以降になると、モデルの説明力が70%を超えます。野生の生物分布に関する分析で、こんなに説明力のあるモデルを、私は今まであまり経験したことがないです。
つまり、パンデミックは決定論的に発生する、ということです。
このような分析の有用性について
COVID-19問題は、数年スケールの長期戦になりつつあります。今回のパンデミックを制御しても、第2波、第3波があると予想されています。したがって、感染拡大の要因を特定することは、今後も繰り返される地域的な感染動向を予見する上でも重要だと考えます。地域の気候やCOVID-19に関する感受性に対応させて、制御対策を検討することの参考になるかもしれません。また、COVID-19の地域的な抑制要因を探索することで、ワクチン開発に役立つ情報を見つけることができるかもしれません。
分析結果を元にした雑感(私見)
パンデミックが決定論的に進行するのであれば、マクロ的な対策を検討できないでしょうか。今回の分析から、国際的な人の移動が感染拡大の主要ドライバーと判明したので、地域・国境をまたぐ人の移動を感染拡大状況に応じて未然に予防する、といった対策です。
例えば、モデル説明力が急速にアップし始めるのは、3月になってからで、説明力が50%を超えるのは3月10日から15日の間です。3月上旬の段階で、近い将来の感染拡大は予見できる状況だったことになります。この段階で、出入国を制御することも検討できたのかもしれません。台湾は、まさにそれをやった訳です。1月から検疫を強化して、中国からの入国禁止、中国への渡航禁止を、2月6日までにコンプリートしています。2月5日時点でもモデルの説明力は40%以上あります。台湾の先手防疫は適切だったと思えます。SARSの経験もあったので、初動対策が迅速だったと言われているようです。実際、台湾のCOVID-19感染者数は、とても低い水準で抑えられており、その対策は国際的に評価されています。
https://www.nippon.com/ja/japan-topics/g00838/?pnum=1
先週、アップルが端末ユーザーの行動情報を公開しました。1月の行動量(モビリテイー)を基準にして、その後のモビリテイー(車の運転・徒歩・公共交通機関の利用)の日変化が相対値として提供されています。
https://www.apple.com/covid19/mobility
台湾ユーザーの行動をグラフ化すると、以下のようになっています。破線はモビリテイーの世界平均です。
まずは破線(モビリテイーの世界平均)のトレンドから、パンデミックが顕在化する3月になると、各国の都市封鎖のため、世界的に行動抑制しているのがわかります。しかし、台湾は比較的通常の生活ができている事がわかります。1月から検疫を強化して2月初旬に国境をまたぐ人の往来を制限したから、台湾国内的にはこのような行動でもよかったのでしょう。
一方、日本あるいは東京は、以下のようなモビリテイーです。
日本・東京のモビリテイーは、国際的なトレンド(破線)から全くかけ離れています。2月下旬に学校の一斉休校や行動自粛の要請が出た後は、週末のモビリテイーピークが抑制されていることはわかります。みんなで頑張って週末は行動制限したことが明らかです。しかし、3月中旬の3連休で油断して、モビリテイーが元に戻ってアップしたこともわかります。また、平日の行動は全く抑制されていないので、モビリテイーのベースラインにあまり変化がなかったことも明らかです。
日本のモビリテイーは、パターンとしては台湾のそれと似ているのですが、入国・渡航制限に関する先行対策の有無が、その後の両国の違いを決定的にしたと思われます。比較的小さな国だと、先手を打った封じ込め防疫ができるのでしょうけど、日本のように大きな国だと、難しいのでしょうか。
ちなみに、イタリアやスペインやニューヨークのモビリテイーは、以下のようになっています。2月下旬からの行動制限で、モビリテイーが劇的に制御されてます。
日本における感染の封じ込みや抑え込みの対策(80%行動減)の実効性については、COVID-19対策の疫学専門家が数理モデルとデータに基づいて、科学的(合理的)に説明されています。ですので、地域をまたぐ移動は控えて、80%行動減を、日本の私たちはやならなくてはいけませんね。
注意点
以上紹介した分析結果はプレプリントの内容ですので、論文審査などを通してオーソライズされたものではありません。感染症の対策などについて、記事の末尾に雑感を述べていますが、それは専門外の研究者の私見です。理論疫学や公衆衛生学の研究者の方から見ると、意味のないことを述べているかもしれません。何かコメントやご意見などありましたら、久保田宛(kubota.yasuhiroアットマークgmail.com)でDMをお願いします。