生物多様性ビッグデータ①：その危機？

私は、”生物多様性ビッグデータ”という言い方を（あえてよく）するのですが、世の中で言われているような”ビッグデータ”とは、少し違うのかな？と思っています。

まず、生物多様性のデータ規模は（かなり）小さいです。

これは、生物多様性情報の多くが、人力で収集されているためです。生態学者が野外調査で生物の分布を記録したり、分類学者が種を分類して記載したり等など。

生物多様性データは、ネットワーク化された情報基盤（ICTなど）で自動で機械的に収集されるデータとは、全く異なるのです。

研究者が手作業で集めるのですから、なかなかビッグなデータになりませんし、研究者がデータ収集するのをやめたら、それで終わりです。データ自体も雲散霧散して、消失することすらあります。

つまり、生物多様性情報は、地道な「基礎研究の歴史」で集積された知見なのです。

生物多様性のデータの規模や、その収集が人手に依存している点では、ビッグデータというのは大げさかもしれません。しかし、集積の時間スケールは、間違いなくビッグデータと称すべきものです。

基礎研究の歴史は、研究を行う基盤と研究者が揃っていればこそ持続可能です。したがって、研究基盤と研究者層が脆弱になれば、歴史は途絶えますし、データの集積も立ち行かなくなります。

私は、生物多様性ビッグデータの可能性を強調してますが、生物多様性ビッグデータの危機についても、もっと強調したいです。

以下に、興味深いデータを紹介します。

スクリーンショット 2019-09-21 18.18.31

これは、日本の生物種の分布記録が、時系列でどのように集積されてきたのかを示しています。横軸は年代、縦軸は各年代に収集された生物種の分布データの数です。なお、このデータは、科学的分析に耐えうる精度の高いデータにクリーニングされた後のデータ数です。信頼性の低いデータは除いた分布記録数です。なお、現状のデータ整備の完全性が高いのは2013年までに観測されたデータです。2014年以降については、現在もデータ整備中なので、グラフのトレンドは2013年までを見てください。

そして、以下の動画は、植物の分布データ集積の時空間パターンです。

https://www.youtube.com/watch?v=TDVaBtNSAgY

分布記録データの収集は2000年くらいにピークを迎えて、その後、2013年までデータの収集量が停滞しているように見えます。このパターンは、植物、哺乳類、鳥類、爬虫類、両生類、淡水魚類、全ての生物分類群に一貫しています。

日本の生物多様性の情報基盤の整備に、何か起こっているのでしょうか？

次回（以下）の記事では、この理由を考えてみたいと思います。

https://note.com/thinknature/n/nc2c059eb7192

※本記事のグラフは、環境省の環境研究総合推進費プロジェクト（環境変動に対する生物多様性と生態系サービスの応答を考慮した国土の適応的保全計画）の結果の一部です。

https://thinknature.studio.design/

BLOG INDEX

NEWS INDEX