新型コロナウイルス感染分布のマクロ生態学的な分析(3月27日時点情報・4月5日追記)
本記事の内容は、その後、論文として2020年9月にPLOS ONE誌に掲載されました。
https://journals.plos.org/plosone/article/authors?id=10.1371/journal.pone.0239385
はじめに
3月末に研究室で新型コロナウイルス問題について議論になり、新型コロナ感染の地理的パターンを、マクロ生態学的な観点から分析することになりました。
新型コロナウイルス感染の地理的パターンを可視化した結果をお知らせします。
なお、データ整備と分析のアクションをスタートさせたのは3月27日で、既に1週間経過しています。今現在の感染者数の地理的パターンは大きく変化しています。データ整備を自動化するプロセスを構築できたので、今後、アップデートしたデータの分析結果を追記していきます。
追記)この記事の後で、データ整備と分析を進めて論文にした内容は、以下の記事でも解説しております。
https://note.com/thinknature/n/nee5bc628ff08
https://www.medrxiv.org/content/10.1101/2020.04.20.20072157v1
データ:感染者数の地理分布と感染地域の環境情報
世界中の新型コロナウイルスの感染者情報(3月27日時点)を、各国の県または州ごとに合計4303地域について収集して、地域ごとの感染率を計算して地図化しました。これらには感染者ゼロの国や地域も含んでいるので、3月27日時点での全世界の感染者情報を網羅しています。
以下の地図は人口100万人あたりの感染者数(3月27日時点)です。赤い地域ほど、感染率が高いことを表します。
追記)4月2日時点の感染者数の地理分布データを、とりあえずアップデートできました。以下4月2日時点と3月27日時点地図を比較すると、合衆国や南米のチリなどの感染者数が急増していることがわかります。今後も、各国・地域で感染者数が増大して、地図のカラーパターンは急速に変化していくと思われます。
追記)このアップデートした4月2日時点のデータ分析の結果は来週にお知らせするとして、以下は3月27日時点データの分析結果です。
データと分析結果を観る上の注意点
上述したように、今現在も、感染地域が拡大して感染者数が増加しているので、国・地域の人口当たりの感染者数(感染率)は、日々変化しています。したがって、現在の感染率が低いことが、その地域が安全であるということでは全くありません。
データについて
感染率の地理的パターンを分析するための付帯情報として、感染に影響を与える可能性のある環境情報(4303地域ごとの気候条件、人口密度、経済水準、人の移動などのデータ)も整備しました。また、新型コロナウイルスの感染には、BCG接種やマラリアの予防対応も関係しているという「宿主集団の免疫仮説」もあるので、地域ごとのBCG接種やマラリア感染に関わるデータも併せて整備しました。以下が、データのリストです(冒頭の英文字は変数のラベルを表します)。
country: 国名
region: 地域名
lon: 州都または県都、首都の経度
lat: 州都または県都、首都の緯度
prec: 降水量1_3月平均
temp: 気温1_3月平均
area: 地域面積
pop: 地域人口
GDP: 国内総生産(同じ国の場合、全地域に同じ値を与えた)
GDPper: 国民一人当たりの国内総生産(同じ国の場合、全地域に同じ値を与えた)
Visitor: 海外からの観光ビジネス客数(インバウンド数)(/年)
Mararia: 国ごとのマラリア感染者数(/年)マラリアの予防対応と関係
BCG_year: 国ごとのBCG接種年数(接種を開始してからの年数。ただし一部の国は開始から停止までの年数)
BCG_type: 現在の国としてのBGC接種の状況(全員接種=3、一部接種=2、過去に接種=1、歴史を通じて未接種=0)
BCG_rate: 国ごとの1980年以後の1歳未満接種率の平均値
MultipleBCG: 国ごとの接種を受ける回数
TB: 国ごとの100万人あたりの結核発症者数
Age65: 国ごとの65歳以上人口割合
Cases: 3/27時点の感染者数
以上の情報元は、末尾の分析データのソースを参照してください。なお、この記事を発表した後、各地の感染開始時期を考慮すべき、というご意見をいただいたので、感染時期データについても、可能な限り揃えることを考えています。
生息適地モデルによる感染パターンの予測
マクロ生態学や生物地理学では、生物の生態学的ニッチの概念に基づいた生息適地モデル(habitat suitability model)という分析手法があります。
以下の図は分析の流れを示しています。今回の分析の場合、(a)データの収集は、各国が集計している新型コロナウイルスの感染者情報、および感染者の分布に対応した環境情報になります。(b)統計モデリングは、今回の場合、MaxEntによるモデリングで、新型コロナウイルスのニッチの当てはめには、気温と降水量の2変数を用いました。そして(c)空間的な予測では、新型コロナウイルスの潜在的な分布を世界スケールで投影しました。
Antoine Guisan 著,久保田康裕 監訳(2020)『野生生物の生息適地と分布モデリング―Rプログラムによる実践―』共立出版,図4.1 より引用
ウイルスは半生物ですが、生息するために適した環境ニッチがあり、その感染分布には気候環境(気温や降水量)が関係していると考えられます。また、世界的に見て新型コロナウイルスが、どの地域に拡散できるのかを把握する上でも(ウイルスが侵入していない地域に、どれくらい感染拡大するのかを理解するためにも)生息適地モデルによる予測は、リスクを大まかにでも認識する上では、一定の意味があるでしょう。このような考えのもと、現状の新型コロナウイルスの感染者分布データに生息適地モデル(MaxEnt)を適用して、整備した環境データの中の気候変数(気温と降水量)のみを用いて、感染者分布の世界的パターンを投影しました。
世界を5㎞メッシュに区切って、メッシュごとの気候(気温と降水量に関する変数)をもとに、新型コロナウイルスの分布適地を投影した結果が以下の地図です。
気候モデルの結果
AUC (統計用語集を参照) 0.7037、降水量 28.7%、気温 71.2%
注)地理分布の予測は定常的な地理分布を説明するための分析なので、今回の場合、厳密には問題です。これは後述する重回帰分析も同様です。したがって、このような統計分析を、新型コロナウイルスのような動的データに適用する事自体が問題である点も認識しておいてください。
現状の感染者の分布データを用いた生息適地モデルでは、気温と降水量によって新型コロナウイルス感染の地理分布が説明されます。中緯度から高緯度の生息適地に感染者が広がると予想できます。一方、実際の感染者の地理分布と比較すると、以下のように左地図(記事冒頭の地図の再掲)なっており、新型コロナウイルスの生息適地予測(右地図)とはかなり異なります。
つまり、感染が様々な地域に拡大することと(新型コロナウイルスが潜在的に分布できるかどうかということと)、その後、感染者数が増大することには、それぞれ別の要因が関わっていると考えられます。
気候要因だけでなく、宿主密度要因(人口密度)、宿主の移動要因(観光客など人の移動量)、宿主集団の免疫力などが、感染者数に影響していると予想されます。
新型コロナウイルス感染率の説明要因
そこで、感染率(100万人当たりの感染者数の対数値)を応答変数にした、単純な重回帰分析を行いました。説明変数は以下の通りです。
空間要因:以下の9変数
緯度
経度
緯度の2乗
経度の2乗
緯度*経度
緯度の2乗*経度
緯度*経度の2乗
緯度の3乗
経度の3乗
気候要因:以下の3変数
気温(1~3月の平均)
気温の2乗(1~3月の平均)
※気温は特定の気温の地域で感染者が多いという見解もあるため、2乗項を加えた。
宿主密度要因:以下の1変数
地域の人口密度
※地図に予測値を投影する際は、メッシュごとの人口密度の値を用いた。
宿主の移動要因:以下の2変数
人口に対する観光客数(人口1人あたりの海外観光客数の比)
一人当たりGDP (人口1人あたりの国内総生産量)
※人口に対する観光客数は対数変換した。
宿主集団の免疫力
マラリア感染者率(人口に対するマラリア感染者数の割合)
65歳以上人口割合(全人口に占める65歳以上人口の割合)
BCG接種効果(以下5変数を主成分分析で要約し、その第一軸値をBCG接種効果とした)
1)BCG接種率(1980年以後の1歳未満接種率の平均値)
2)BCG接種を開始してからの年数(一部の国は開始から停止までの年数)
3)BCG接種を受ける回数
4)現在の国としてのBGC接種状況(全員接種=3、一部接種=2、過去に接種=1、歴史を通じて未接種=0)
5)100万人あたりの結核発症者数
なお、以上の変数の間には、多重共線性がないことを確認しています。VIF(統計用語集を参照)は最大でも2.5以下でした。
以下、回帰分析の結果です。各要因の寄与率と変数ごとの標準偏回帰係数を示しています(*は有意であることを意味します)。
気候要因や宿主(人口密度)は感染率に有意な影響を与えていますが、寄与率は比較的小さいです。
気候要因 (寄与率 0.27%)
1~3月気温の2乗 -0.60**
1~3月気温 0.50*
1~3月降水量 0.02
宿主密度要因 (寄与率 0.33%)
人口密度 0.06***
宿主(人)の移動が活発な地域ほど、感染率が大きくなることが明らかです。
宿主の移動要因 (寄与率 5.58%)
一人当たりGDP 0.14***
人口に対する観光客数 0.29***
BCG効果やマラリア感染率が高い地域ほど感染率は小さくなり、高齢者が多い地域ほど感染率が大きく、宿主集団の免疫力(と仮定される要因)の寄与率が大きいです。
宿主集団の免疫力 (寄与率 9.39%)
BCG効果 -0.35***
マラリア感染者率 -0.14***
65歳以上人口割合 0.076**
以上数値で示した新型コロナウイルスの感染率に対する、一連の説明要因の寄与率をグラフ化したのが、以下になります。
重回帰分析に組み込んだ、宿主集団の免疫力は(年齢の効果を除いて)生物学的な根拠が十分でない(不確かな)変数で感染率に関わる寄与率が大きいです。ただし、国・地域の宿主集団の免疫力の影響は、世界的な感染拡大制御の観点から解釈すべきことなので、日本国内の感染拡大制御とは分けて考えるべきことを強調しておきます。国内・地域内においては、宿主集団の免疫力はほぼ同じ条件になるので、安心する要素にはなりません。国際的にも国内・地域的にも、より重視すべきことは、宿主(人間)の移動要因が感染率に最も関わっている点です。
新型コロナウイルス感染率マップ
以上の回帰分析の結果を元に、現状の感染率データを元に、新型コロナウイルスの感染率を地域ごとに予測しました。ここでは感染率を感染リスクと定義しました。
この地図を見ることで、新型コロナウイルスの感染率が高い地域と低い地域を把握することができます。繰り返しになりますが、現在の感染率の低いことが、その国・地域が安全であるということではなく、あくまで現状データ(3月27時点データ)での感染リスクで、今後の感染拡大でリスクの地理的パターンは変化します。
日本を拡大した感染率リスクマップは以下になります。
日本の感染率の地理パターンをわかりやすくするために、感染リスクのカラーパターンを調整しています。上の世界地図のカラーパターンと異なる点に注意してください。
都道府県の境界でリスクが不連続に変化しているのは、感染者情報が都道府県ごとにしか公開されていないケースが多いためです。京都と北海道で周囲の県と比べ感染リスクが高いのは、通常(例年)の状態での観光客数が多いためです。また都心部周辺のいくつかの自治体の感染リスクが低くなっています。この要因は、今回の分析では都心部と周辺自治体の人の日常的な移動を考慮していないためです(この分析では各都道府県のインバウンド数しか考慮していません)。また人口が少ない山地でリスクが高いのは、気候的に低温なので新型コロナウイルスの潜在的な適性度が高くなるためです。
以上の分析では、応答変数の感染率と様々な説明変数の生物学的な因果関係は不明確です。感染率の地理分布を大まかに予測する探索的な分析に過ぎません。しかしながら、分析手法に問題と限界はあるにせよ、地域ごとの感染リスクを認識して、私たちが注意するための目安を与えてくれると考えています。3月27日時点データの分析結果から、日本国内における新型コロナウイルス感染リスクは各地域と外部の「人の移動」に関係していると推論されます。これと元に考えると、4月は都心と地方の間など、人の移動が多くなる時期なので、移動者を介した感染リスクが高まるように思います(私見)。感染症対策の専門家の方が繰り返し言われているように、ソーシャルディスタンスそして自宅待機することが重要と思います。
分析の問題点
今回の分析は、生息適地モデルと、空間構造を考慮した単純な重回帰分析モデルなので極めて初歩的です。今現在も、新型コロナウイルスの感染者の地理的分布は拡大し、感染者数も増大しています。したがって、国・地域ごとの感染開始時期などを考慮した分析、あるいは感染開始から今後も含めて、時系列で感染者数の地理的パターンの変化を追跡して分析する必要があります。本文中にも述べたように、このような地理分布を予測するための統計モデル(生息適地モデルや重回帰分析)は、定常的な分布データに適用するべき手法なので、厳密には問題があります。したがって、最終的に新型コロナウイルスの問題が終息した後で、検証を行うべきと考えています。
分析データのソース
コロナウイルス感染者数のデータ
世界. Johns Hopkins University. CSSEGISandData<https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_daily_reports>
イタリア. Dipartimento della Protezione Civile. <https://github.com/pcm-dpc/COVID-19/tree/master/dati-province>
日本. ジャッグジャパン株式会社. 都道府県別新型コロナウイルス感染者数マップ. <https://gis.jag-japan.com/covid19jp/>
韓国. MOHW. Coronavirus Disease-19, Republic of Korea. <http://ncov.mohw.go.kr/bdBoardList_Real.do?brdId=1&brdGubun=13&ncvContSeq=&contSeq=&board_id=&gubun=>
スペイン. Situación de COVID-19 en España. <https://covid19.isciii.es/>
フランス. Infection au nouveau Coronavirus (SARS-CoV-2), COVID-19, France et Monde. <https://www.santepubliquefrance.fr/maladies-et-traumatismes/maladies-et-infections-respiratoires/infection-a-coronavirus/articles/infection-au-nouveau-coronavirus-sars-cov-2-covid-19-france-et-monde>
ドイツ. COVID-19: Fallzahlen in Deutschland und weltweit. <https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Fallzahlen.html>
イギリス. NHSR_Cases_table. https://www.arcgis.com/home/item.html?id=ca796627a2294c51926865748c4a56e8
インド. COVID-19 in India. Dataset on Novel Corona Virus Disease 2019 in India. <https://www.kaggle.com/sudalairajkumar/covid19-in-india#covid_19_india.csv>
ブラジル. Máscaras caseiras podem ajudar na prevenção contra o Coronavírus. <https://saude.gov.br/>
チリ. Casos confirmados en Chile COVID-19. <https://www.minsal.cl/nuevo-coronavirus-2019-ncov/casos-confirmados-en-chile-covid-19/>
アルゼンチン. Confirmed cumulative infections (deaths in brackets) by province, according to data from the provincial governments. <https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_Argentina#cite_note-a-59>
ベネズエラ. Casos de coronavirus en Venezuela. <https://efectococuyo.com/politica/hay-ocho-casos-mas-de-covid-19-y-el-pais-tiene-143-contagiados-dice-maduro/>
ニュージーランド. COVID-19 – current cases. <https://www.health.govt.nz/our-work/diseases-and-conditions/covid-19-novel-coronavirus/covid-19-current-situation/covid-19-current-cases>
イラン. CoronaTracker. <https://www.coronatracker.com/ja/country/iran/>
インドネシア. Dashboard Pemantauan Kasus COVID-19. <http://covid19.bnpb.go.id/>
パキスタン. CORONAVIRUS IN PAKISTAN. <http://covid.gov.pk/>
ロシア. Коронавирус – симптомы, признаки, общая информация, ответы на вопросы — Минздрав России. <https://covid19.rosminzdrav.ru/>
スイス. New coronavirus: Current situation – Switzerland and international. <https://www.bag.admin.ch/bag/en/home/krankheiten/ausbrueche-epidemien-pandemien/aktuelle-ausbrueche-epidemien/novel-cov/situation-schweiz-und-international.html>
オランダ. Current information about the novel coronavirus (COVID-19). <https://www.rivm.nl/en/current-information-about-novel-coronavirus-covid-19>
オーストリア. Aktuelle Zahlen aus Österreich finden sie im amtlichen Dashboard zu COVID-19. <https://www.sozialministerium.at/Informationen-zum-Coronavirus/Neuartiges-Coronavirus-(2019-nCov).html>
ベルギー. Coronavirus COVID-19. <https://www.info-coronavirus.be/nl/news/>
ノルウェー. Live: Corona-viruset sprer seg i Norge og verden. <https://www.vg.no/spesial/2020/corona/>
ポルトガル. Ponto de Situação Atual em Portugal. <https://covid19.min-saude.pt/>
スウェーデン. Antal fall av covid-19 i Sverige. <https://experience.arcgis.com/experience/09f821667ce64bf7be6f9f87457ed9aa>
ポーランド. Ministerstwo Zdrowia. <https://twitter.com/MZ_GOV_PL/status/1245431656380608518>
フィンランド. Finland’s corona virus status. <https://korona.kans.io/?language=en>
ボリビア.Wikipedia. <https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_Bolivia>
メキシコ.Wikipedia. <https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_Mexico>
コスタリカ.Wikipedia. <https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_Costa_Rica>
フィリピン.Wikipedia. <https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_the_Philippines>
アイルランド.Wikipedia. <https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_the_Republic_of_Ireland>
ルーマニア.Wikipedia. <https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_Romania>
クロアチア.Wikipedia. <https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_Croatia>
気候データ
WorldClim. WorldClim version 2.1 climate data. <https://www.worldclim.org/data/worldclim21.html>
人口データ
世界. NASA. Gridded Population of the World (GPW), v4. <https://sedac.ciesin.columbia.edu/data/collection/gpw-v4>
日本. 国土交通省. 国土数値情報 1kmメッシュ別将来推計人口(H29国政局推計). <http://nlftp.mlit.go.jp/ksj/gml/datalist/KsjTmplt-mesh1000.html>
地域・国の面積データ
GADM. GADM maps and data. <https://gadm.org/index.html>
旅行者数データ
世界. World bank group. World Development Indicators. <https://datacatalog.worldbank.org/dataset/world-development-indicators>
日本. 観光庁. 共通基準による観光入込客統計 <https://www.mlit.go.jp/kankocho/siryou/toukei/irikomi.html>
GDPデータ
世界. World bank group. World Development Indicators. <https://datacatalog.worldbank.org/dataset/world-development-indicators>
日本. 内閣府. 国民経済計算(GDP統計).
65歳以上人口割合データ
世界. World bank group. World Development Indicators. <https://datacatalog.worldbank.org/dataset/world-development-indicators>
日本. 内閣府. 令和元年版高齢社会白書. <https://www8.cao.go.jp/kourei/whitepaper/index-w.html>
BCG接種データ
Word Health Organization. BCG Immunization coverage estimates by country. <https://apps.who.int/gho/data/view.main.80500?lang=en>
The BCG Atlas Team. The BCG World Atlas 2nd Edition. <http://www.bcgatlas.org/>
マラリア感染者数のデータ
Word Health Organization. World malaria report. <https://www.who.int/malaria/data/en/>
分析チームについて
本記事の関わるデータ編集は久保田研究室のデータ整備スタッフが行い、データ分析は研究員が主導して行いました。そして、結果の解釈と本記事の執筆は、久保田と研究員で行いました。
謝辞
図書(Antoine Guisan 著『野生生物の生息適地と分布モデリング―Rプログラムによる実践―』)の図の引用を了承していただいた、共立出版には感謝いたします。