COVID-19 東京都の感染者数プロファイルの解析
Profile analyses of COVID-19 affected numbers in Tokyo [July 3, 2020]
SIコンパートメント・モデルに対応するロジスティック関数を用いて,東京都の確定日別の累計感染者数を解析します。
使用しているデータは,東京都の公開データ "確定日別による陽性者数の推移"の累計陽性者数のみです(https://stopcovid19.metro.tokyo.lg.jp/?tab=reference)。陽性者を感染者とし,日別の感染者数は,当日の累計数から前日の累計数を差し引いた増分値としています。
採用したモデルでは,累計者数は複数のロジスティック関数の和とし、ここでは2個の関数の和としています。報告されている累計者数にモデルの関数ができるだけ合致するように,関数を最適化しています。
累計者数とモデルによる累計数は,図に表す上で,最新の累計者数(最大値)で除して,それぞれ累計obs'と累計calc'としています。最新の累計obs'は1です。
図1を見ると,累計obs'と累計calc'がよく重なって,モデルとその最適化が適切であることを表しいてます。
増分値を累計数で除した値の7日間移動平均を7倍した値(先のブログで述べたm7値)を,"移動平均'×7"として図示しています。ただし,分母の累計数は,報告値のばらつきを低減するため,最適化で求めた各関数の累計数に置き換えています(平均化については後述を参照)。
"移動平均'×7"は,ここで採用している,SIモデルなど,モデル関数にはほとんど依存しない,感染プロファイルの固有の特性を表します。一方,図には先のブログで述べた,モデルから算出される
τm値(COVID-19では実効再生産数の目安となる)を"増加率×7"として挙げました。"移動平均'×7"と"増加率×7"はほぼ対応しているといえます。このことは,採用したSIモデルと解析の妥当性を証明するものです。
"移動平均'×7"が,"増加率×7"よりも小さい(下方の)時は,これまでの増加の傾向と比較して,収束の傾向,"増加率×7"よりも大きい(上方の)時はいっそう拡大の傾向を意味します。
7月4日以降では,取扱いに一般性を持たせるために,"移動平均'×7"を"τ×平均"に,"増加率×7"を"τ×増加率"に変更しています(後述があります)。
"移動平均'×7"が,"増加率×7"よりも小さい(下方の)時は,これまでの増加の傾向と比較して,収束の傾向,"増加率×7"よりも大きい(上方の)時はいっそう拡大の傾向を意味します。
7月4日以降では,取扱いに一般性を持たせるために,"移動平均'×7"を"τ×平均"に,"増加率×7"を"τ×増加率"に変更しています(後述があります)。
Fig.1 東京都の感染者数: データ(obs)と計算値(calc) [July 2nd]
|
K値の挙動
最近のK値も図示しましたが,先の"K値を厳密に取り扱う"で指摘したように,"移動平均'×7"とはぼ同じ挙動となっていますが,ほぼ7日間の遅れ(7日前の挙動)となっていて,ここ数日の感染者数の増加を表すことはできていないように見えます(図の矢印の先)。
図1には,日別の感染者数を"日別obs",モデル関数を時間で微分した計算値を"日別calc"として,共に挙げました。日別の感染者数には大きなばらつきがありますが,そのプロファイルの様相を計算値はよく表現できています。"移動平均'×7"は日別の感染者数の変化も反映しています。ただし,移動平均の取り方の制限から,最新3日間の取り扱いはその前方とは異なっています。
ここでの最適化に用いたパラメータはわずか6個,2組のP,rとTだけです。解析処理も単純ストレートなものです。これまでのデータに含まれている様々な事象(さまざまな事柄,人々の営み,...)を語ることができるものではありません。そして,過去のデータから将来を予測はできません。しかし,何かが起きていた,傾向が変わってきたことは定量的に把握できます。このことが,将来の取り組みに何らかの寄与をもたらすことができればと望みます。
解析処理
ここでの最適化に用いたパラメータはわずか6個,2組のP,rとTだけです。解析処理も単純ストレートなものです。これまでのデータに含まれている様々な事象(さまざまな事柄,人々の営み,...)を語ることができるものではありません。そして,過去のデータから将来を予測はできません。しかし,何かが起きていた,傾向が変わってきたことは定量的に把握できます。このことが,将来の取り組みに何らかの寄与をもたらすことができればと望みます。
ここでのデータは,7月2日公表の7月1日までに判明した確定日別の陽性者数です。このデータでは,確定日が判明していない陽性者数が後日追加されて行くというものです。そのため,最新の数日については,その後の発表の都度,数が相当数増えていきます。
今後の推移に注目しましょう。
移動平均の取り扱い
"移動平均'×7"は先のブログのm7に相当します。m値自体はある特定の日の値として定義しています。移動平均は,報告データのばらつき(曜日や休日によって検査と集計に偏りが生じています)を単に低減するための操作です。平均化によって意味のある変動がスムーズアウトされることはあり得ます。乗数7は実効再生産数と対比させるための時間日数でもあります。
ここでは,移動平均の累計数は,図示する範囲の10日ほど前の日を基準日とし,その日の値を以降の累計数から減じてから,平均値を算出しています。これは,感染の初期の累計数が小さいために大きなばらつきを示してしまうからです。この基準日の選択の任意性は,数日の間のみで,その後の値には影響をほほとんど及ばさなくなります。K値についても同じ基準値の操作を適用しました。
7月4日以降は,移動平均の分母の累計数としては,各関数から計算される累計数を用いたものに変更しました。この累計数は小さな値から連続的に増大するため,基準日の取り扱いは無くなり,基準日の恣意性が無くなって一般性も向上しています。
ここでは,移動平均の累計数は,図示する範囲の10日ほど前の日を基準日とし,その日の値を以降の累計数から減じてから,平均値を算出しています。これは,感染の初期の累計数が小さいために大きなばらつきを示してしまうからです。この基準日の選択の任意性は,数日の間のみで,その後の値には影響をほほとんど及ばさなくなります。K値についても同じ基準値の操作を適用しました。
7月4日以降は,移動平均の分母の累計数としては,各関数から計算される累計数を用いたものに変更しました。この累計数は小さな値から連続的に増大するため,基準日の取り扱いは無くなり,基準日の恣意性が無くなって一般性も向上しています。
7日間移動平均は,ある日と前後3日間の平均としています。ただし,最新の日とその2日前までについては,最新の日は当日の値,その1日前は3日間移動平均値,2日前は5日間移動平均値としています。これら日々のばらつきは大きくなりますが,最新の兆候を反映し易くなります。もちろん,時間の経過とともに7日間移動平均に代わるため,ばらつきは少な目になります。
0 件のコメント:
コメントを投稿