リリース

2022.02.17 News リリース

第6波が下がった理由は何か

CATs-QUICKは2022年1月25日から東京都の新規感染者について、具体的なピークの予測を行ってきました(予測公開開始は1月24日ですが、具体的なピークの日付予想を公開し始めたのは25日)。

*CATs(Collective Analysis Teams, [旧称Collective Analysis Tracking System])とは、新型コロナウイルス感染抑制と経済社会被害の抑制を両立することを目指し、調査分析・提言を行ってきた民間有志によるチームで、社会科学からビッグデータ、AIに至る専門を持つメンバーが参加しています。情報ベンダーである株式会社QUICK(本社:東京都中央区、代表取締役社長:髙見信三氏、以下「QUICK」)と提携し、ビッグデータ分析による第6波のピークアウト動的予測をリアルタイムで公開しています。

 

新型コロナウイルスのオミクロンによる第6波に対しては、様々な研究チームが様々な手法に基づきシミュレーション予測を行ってきました。予測は常に固定というわけではなく、複数の研究チームが事態の推移に伴い情報をアップデートして予測を「更新」してきました。その中で、日次で新たな情報を取り入れ、その日のうちに予測が更新される動的予測は、CATs-QUICKのみです。

CATs-QUICK予測は、1月25日から継続して、東京都の新規感染者数の7日間移動平均のピーク予測を2月1~9日としてきました。実際に、7日間移動平均は2月8日にピークを打ち、減少加速8日目です。CATs-QUICKは、過去の第5波までのデータを検討した結果、現在のフェーズを【下降序盤】と判定しています。

 

2月8日にピークを記録してから、各メディアからなぜ波が下がったのだろうか、なぜこの予測が現実と合っていたのだろうかというご質問をいただくことが多くなりました。専門家が指摘するように、新型コロナウイルス感染症の流行や収束は複合的な要因に基づいており、また社会の動きは複雑系であるためストレートにお答えすることは難しいのですが、以下、CATsとしての見解を記しておきたいと思います。

第5波が収束した理由は複合的、というのが尾身分科会長の見解でした。テレビで発言する専門家もそれぞれあげる理由はバラバラでした。「マスクをキュッと締めたから」とか、「若年層の行動が変わったのではないか」とか、「ワクチンの効果である」とか、それぞれに強調するポイントが違いました。テレビなどで簡略化して伝えられることの多い場面ではなく、もっと厳密に表現すれば、多くの専門家が尾身会長と同じく複合的だと考えていたのだと思いますが、これらの理由を厳密に証拠立てることはおそらく不可能です。

第5波がピークを越えてからの感染者数の下がり方は、ワクチンだけでも、人流でも説明ができませんでした。つまり、複合要因と考えられるが、そのすべてを専門家が知っているわけではないということが示唆されます。仮に、分かっている要素が2割、分からない要素が8割としましょう。2割部分のデータだけで正確な予測をすることは不可能です。

ではなぜCATs-QUICKが第6波のピークを予測できたのか。それは、ビッグデータ分析と機械学習を組み合わせているからです。また、一口に機械学習と言っても、様々なタイプのAIがあります。細部に着目して「学習」してしまいすぎる高度なAI、それほど能力が高くない代わりにざっくりとしたパターンを見つけ出すのが上手いAI…。重要なのは、感染抑制に効く「すでに分かっている少数の要素」に頼り切って仮説に引きずられるのではなく、ありとあらゆる方式を試しつつ、パターンを読み取ることです。

パターンと言っても、例えば海外のオミクロンの波の形を単純に模倣するとか、いまある線を延長してフリーハンドで描いていくということでは全くありません。そうすると単なる直観に基づくお絵かきになってしまいます。人間の直観ではもちろんだめ、しかしパターンを読み取るような直観も重要。これが、CATsが基づいている分析の考え方です。

CATsが分析している行動変容インジケーター(指標)一つとっても、数百の個別の指標を分析して作られたものです。分かりやすい例を挙げれば、人びとは在宅ワークになると出前やUber Eatsを頼んだりします。しかし、なかには一見関係のなさそうなものもあります。人々が感染対策に気を付けるようになると、そうした情報の検索が増えるのは当たり前ですが、インテリアについての検索も増えるのです。要は、関心が家の中のことに向くようになって、そこにお金をかけたくなるということでしょう。

心理サイクルのイメージが毎日の予測に示されていますが、これは定量的に人々の感情を分析し、表したもの。行動変容インジケーターには、例えば「恐怖指数」も含まれています。下り局面では「コロナ疲れ」の指数が目立って増えてくる。そうしたソフトな人々の意識をどれだけ定量化して分析に入れ込むかによって、見えづらいものが見えてきます。

人々の行動は複雑であり、社会における人々の関係性や接触のあり方も多種多様です。都市の人口周密度や街の構造がもたらしている特徴もあるでしょうし、高齢化率などのデモグラフィックも効いてきます。ただ、それぞれについて、ひとつひとつ仮説を立てて、仮定の値を入力して積み上げた予測はなかなか当たりません。なぜでしょうか。

それは、現時点ではどんなに理論的な精緻化を試みても、現実世界の方がもっと複雑系だからでしょう。そうしたとき、ビッグデータ分析と機械学習の組み合わせは日々刻々と変化する現状把握を見逃さないことで、より現実に即した予測を立てることができるのです。

そのためには、より正確な人流データ、多種多様なビッグデータを集め、日々新しく更新される人々の行動などをモデルに都度入力して、予測をアップデートしていくことが重要です。CATsの試みのうち、重要なものとしては民間企業の協力を得てその力を結集しているということがあります。残念ながら、これまで日本の政策決定には活かされてこなかった大量の貴重なデータです。それらの分析過程を通じて、いくつかのことが分かってきます。

例えば、過去の波に対するCATsの分析からは、「感染が増える局面では人流が波の高さにある程度影響を与える」ことが分かっていますし、同時に「感染が減っていく局面では人流は減り方にさほど大きな影響を与えていない」ことが分かっています。また、波がきていない2021年秋の時点では、人流がどんなに回復しても感染者数は増えませんでした。専門家がどんなに夏休み明けの学校での活動に懸念を表明しても、ワクチンさえ打っていない子どもたちから感染が広がるようなことはありませんでした。昨秋の時点では人流と実効再生産数はあまり相関していなかったということです。ここの理由付けをもっと研究していくのは研究者の仕事ですが、要は、「人流は常に等しく影響を与えるわけではないし、人流が感染の規模と関係ないわけでも全くない」ということです。

手に入るビッグデータを可能な限り使い、AIに多様な学習をさせつつ、日々モデルを複数持ちつつアップデートさせていく。同時に、感染制御による副作用についても分析する。ある政策をとった結果として、どんな被害が生まれたかも見落とさない。これからの感染症対応には、こんな分析が求められていくように思います。

AIやビッグデータは遠い先の未来を占うわけではありません。時間の猶予がないような緊急事態において、一歩先の未来について「確からしいこと」を提供する。「何もかも分かっている」のではなくて、「分からないことがたくさんある」ことを理解したうえで、最善の予測をするという態度が重要なのです。