データサイエンスから見た新型コロナウイルス・パンデミックの姿は!?

2020年4月17日 by Tomoyuki HAYASHIDA
cloud.jpg

二、三年ほど前に東大で医療データベースの分析研究発表会のようなものが行われ、日本の医学研究のトップの大学医学部、医学研究所の先生方と、日米の民間の AI 先端企業の何社かが発表されていたの拝聴したことがありましたが、その際に感じたのは、日本の医学研究の中で、ビッグデータ分析に対するデータサイエンティスト的な研究発表をされている研究者がほとんどいないなと感じていました。

さすがに現時点では、医学研究ばかりでなく、通常の医療にもデータサイエンスが活用されている、と信じていますが、世界中の新型コロナウイルスによる莫大なデータが、データマイニングとしても、多くの知見を導き出しているのでは、と想像されます。

もちろん厚生労働省や大学、研究所では、これらのビッグデータの AI 分析が当然のように行われていて、ただ現時点で外部公表するには、リスクが大きく公開されないのだろうということも容易に想像されますが、世界に目を向けると、AI の先進国である、米中に、やはり自国としても莫大なデータがあり、いろいろな分析が行われて知見を積み重ねているのだろうと考えられます。

下記は、ジョンズ・ホプキンズ大学の集計数字(2020/4/17現在)を単に計算(割り算)しただけの数字ですが、こんな単純な比較においても何らかのことが言えそうな気がします。

回復率を、回復者数/累積感染者数と仮定すると、欧米とアジアのいくつかの国の数字は、

・中国: 89.3 %
・韓国: 73.6 %
・台湾: 39.2 %
・ドイツ:59.4 %
・スペイン:40.4 %
・イタリア:23.8 %
・フランス:22.7 %
・アメリカ:8.4 %
・日本:10.1 %

となっています。この数字の元のデータの信頼性の問題や各国で定義が異なるなどの問題、感染した人の免疫力の差や医療サービスの違いなどがあるため、これだけで何かを計ることに無理がありますし、上記の一瞬の比較に何ら意味はないのですが、もしこの数字を日々追うことで出来る曲線やベクトルを分析してみれば、想像しうる何かにあたりそうな気もします。

データサイエンスの力が試されていると感じることしきりです。

COPYRIGHT © 2012-2017, Principle BCP Institute, ALL RIGHTS RESERVED