2020/10/25

COVID-19 北海道の感染者数プロファイルの解析 [10月25日]

COVID-19 北海道の感染者数プロファイルの解析 [10月25日]

Profile analyses of COVID-19 affected numbers in Hokkaido [October 25th, 2020]

 
北海道のCOVID-19新型コロナウィルス感染症の感染者数について,本日10月25日発表までのデータを使用して,感染者数のプロファイルを解析しました。
 
北海道のデータについては,10月18日に"COVID-19 北海道の感染者数プロファイルの解析"として,前回のブログに記載しました。その後も感染者数が多い状況が続き,24日には60名と最多を更新しました。ロジステック関数で最適化する方法で今回の解析も同様に行いました。

図1に4月20日から本日までの,日別の感染者数(日別obs),日別感染者数の7日間移動平均価(日別ave)を示します(2月10日からのプロットは前回をご覧ください)。累計calcは最適化によって得た累計値の計算値,日別calcは累計calcから算出した日別感染者数の計算値です。
 
ピークが4月24日にあるプロファイル2は,全感染者数が860名,基本再生産数相当値が2.1で,こちらが全国的に第1波と呼ばれるものに相当します(こちらを第2波と呼ぶことがあります)。このピークは東京都のピークから約10日遅れています。

ピークが8月9日のプロファイル4は,全国的には感染者数が多かった第2波に相当し,本日の解析では全感染者数450名で基本再生産数相当値1.7となり,やはり東京都よりは10日近い遅れです。図1では日別感染者数の計算値も第2波(主要)としてプロットしてあります。
 
9月中旬からのなだらかな大きいプロファイル5をここでは第3波と呼びます。10月23日,24日と過去最多の感染者数が更新され,本日の解析では,このプロファイルが継続するとしたときの全感染者数は2,190名,基本再生生産数相当値は1.5,ピークは10月27日頃となりました。前回の解析では全感染者数1,270名,基本再生生産数相当値1.6,ピークは10月14日頃と見積もられていました。

第3波のピークの日時は,多かった先週の感染者数が影響して2週間近く遅くなり,想定される全感染者数が920名にも増えるという結果が得られました。なだらかなピークプロファイル(基本再生産数が小さい)がさらに広がって,全感染者数は第1波の2.5倍が見込まれます。

1. 北海道の感染者数プロファイルの詳細と再生産率 [図のクリックで拡大]
Data source: 新型コロナウイルス感染症(COVID-19)に関する情報: 北海道オープンデータポータル https://www.harp.lg.jp/opendata/dataset/1369.html

図1には,再生産率をプロットしてあります。この再生産率は日別感染者数の計算値から求めたもので,詳細は"COVID-19 東京都の感染者数プロファイルの解析 [10月11日]"(
図の見方,説明などもこちら)をご覧ください 。再生産率は,1人の感染者が新たに引き起こす感染者の数,すなわち,実効再生産数に相当する値です。

図2の再生産率を見ると,その高いところの値は基本再生産数相当値に対応して現れていますが,プロファイルが重なっているために鈍化して低めの値となっています。再生産率が1を越えると日別の感染者数が増えだし,1を切って小さくくなるところでピークを迎えて減少し始めます。
 
第1波は,2を越える大きな再生産率でしたが,ピークを過ぎると速やかに減少して順調に下がり,0.22まで低下しました。しかし,収束に至る0近くまでは低下せず,その後は上昇し始め,以後は1を挟んで上昇・下降を繰り返しました。第3波のプロファイル5では,現在は1に近い状態にあります。ピークを概ね1週間経過するまでは最適化の精度が充分ではないので,ご注意ください。

図2には,最適化解析の詳細として,各プロファイルの日別感染者数の計算値(プロファイル3についてD f1 calc,プロファイル4についてD f2 calc,プロファイル5についてD f3 calc)などを示します。
2 北海道の感染者数プロファイルの最適化の詳細 [図のクリックで拡大]

図2での感染者数の累計値は,累計数の直近の値(最大値)で除して1となるように規格化して累計obs',最適化した累計値も同じ値で除して累計calc'としてプロットしてあります。この2つのプロットがよく重なっていれば最適化が良好であることを意味します。
 
第2波についての"τ×平均"と"τ×増加率"は,第2波と第3波を組み込んだものです。値は,日別感染者数をプロファイルの累計感染者数で除したものに感染惹起期間τを乗じたもので,平均は感染者数の移動平均値(日別ave),増幅率は最適化から得た計算値(日別calc)を,それぞれ累計の計算値で除して算出しています。

τ×平均は実質的な増加率であり,最適化で得られるτ×増加率を追随しています。これは計算モデルが適切であること,モデルが実際を充分に追跡できていることを意味しています。よく見ると,7月下旬の連休で報告される感染者数の減少を反映してτ×増加率を下回り,その直後は報告数の増加を反映して上回るといった具合に,感染者数の変化も表現しています。このような現象は,8月の連休,そして9月の連休でも表れています。
 
図2の矢印は,直近の計算値の追随性について留意すべき箇所(赤い矢印)を指します。報告される感染者数が現在のプロファイルを大きく越えている(青い矢印)ことから,これが過度的なのか,あるいは,第6のプロファイルが重なって表れてくる可能性を示唆するのか,今後の経過にいっそう注意すべきです。
 
図の見方などは,"COVID-19 感染者数プロファイルの計算モデルと見方"もご覧ください。

2020/10/18

COVID-19 北海道の感染者数プロファイルの解析 [10月18日]

COVID-19 北海道の感染者数プロファイルの解析 [10月18日]

Profile analyses of COVID-19 affected numbers in Hokkaido [October 18th, 2020]

 
北海道のCOVID-19新型コロナウィルス感染症の感染者数について,本日10月18日発表までのデータを使用して,感染者数のプロファイルを解析しました。
 
北海道のデータについては,5月23日に"COVID-19 北海道の感染者数の推移と予測"として,このブログに記載しました。ロジステック関数で最適化する方法で今回の解析も同様に行い,また,再生産率と増加率など,その後に考案した指標で,結果を解釈しています。
 
図1は,2月10日から本日までの,日別の感染者数(日別obs)とその累計値(累計obs),日別感染者数の7日間移動平均価(日別ave)をプロットしています。累計calcは最適化によって得た累計値の計算値,日別calcは累計calcから算出した日別感染者数の計算値です。
 
累計calcは,5個のロジステック関数の和で表され,累計obsとよく重なっており,最適化が良好に行われていることを示しています。日別obsは週内の変動,休日での検査件数の減少とその後の増大,などの影響を受けてばらつきが大きいのですが,日別aveは週内の変動を緩やかにしています。解析で得られた日別calcは,これらの変化の様相を的確に表現しています。日別calcを見ると,感染の拡大・縮小の様子が把握しやすくなります。
図1. 北海道の感染者数プロファイルの最適化 [クリックで拡大]
 
Data source: 新型コロナウイルス感染症(COVID-19)に関する情報: 北海道オープンデータポータル https://www.harp.lg.jp/opendata/dataset/1369.html

図1の3月3日にピークがあるプロファイル1は全感染者数が160名で基本再生産数相当値が2.2,4月24日のプロファイル2は
全感染者数が860名で基本再生産数相当値が2.1で,こちらが全国的に第1波と呼ばれるものに相当します。このピークは東京都のピークから約10日遅れています。この後には散発的な第3のプロファイル3があり,第1波の余波的なものです。全感染者数が280名で基本再生産数相当値が1.6,ピークは6月13日頃です。7月の上旬までは,収束には至らなかった,比較的に感染者数が少ない状態が続きました。

図2に示すように,7月に入って,素のデータでは明瞭ではありませんが,プロファイル4は全国的には感染者数が多い第2波に相当します。全感染者数は500名で基本再生産数相当値が1.7,ピークは8月10日でやはり東京都よりは10日遅れです。図2では日別感染者数の計算値も第2波(主要)としてプロットしてあります。
 
9月中旬からはなだらかでやや高いプロファイル5が現れ,現在はピークにあるようです。このプロファイル5がこれまでの経過を辿るならば,全感染者数は1,270名で基本再生生産数相当値は1.6,ピークは10月14日頃と見積もられました。なだらかなピーク(基本再生産数が小さい)ですが,全感染者数は第1波の2倍が見込まれ,第3波と呼んでよさそうです。
図2. 北海道の感染者数プロファイルの詳細と再生産率 [クリックで拡大]

図2には,再生産率をプロットしてあります。この再生産率は日別感染者数の計算値から求めたもので,詳細は"COVID-19 東京都の感染者数プロファイルの解析 [10月11日]"(
図の見方,説明などもこちら)をご覧ください 。再生産率は,1人の感染者が新たに引き起こす感染者の数,すなわち,実効再生産数に相当する値です。1ならば感染者数は横ばい,1よりも大きければ多きいほど感染は急速に増大し,1より小さければ小さいほど速やかに感染者数は減少します。独立したプロファイルでは実効再生産数の初期の値が基本再生産数にほぼ相当します。

図2の再生産率を見ると,その高いところの値は基本再生産数相当値に対応して現れていますが,プロファイルが重なっているために鈍化して低めの値となっています。再生産率が1を越えると日別の感染者数が増えだし,1を切って小さくくなるところでピークを迎えて減少し始めます。
 
第1波は,2を越える大きな再生産率でしたが,ピークを過ぎると速やかに減少して順調に下がり,0.22まで低下しました。しかし,収束に至る0近くまでは低下せず,その後は上昇し始め,以後は1を挟んで上昇・下降を繰り返しました。第3波と呼ぶプロファイル5では,現在は1を下回っていますが1に近い状態にあります。ピークを概ね1週間経過するまでは最適化の精度が充分ではないので,ご注意ください。

図3には,最適化解析の詳細,各プロファイルの日別感染者数の計算値(プロファイル3についてD f1 calc,プロファイル4についてD f2 calc,プロファイル5についてD f3 calc)などを示します。
図3 北海道の感染者数プロファイルの最適化の詳細 [クリックで拡大]

図3での感染者数の累計値は,累計obsの直近の値(最大値)で除して1となるように規格化して累計obs',最適化した累計calcも同じ値で除して累計calc'としてプロットしてあります。この2つのプロットがよく重なっていれば最適化が良好であることを意味します。
 
第2波についての"τ×平均"と"τ×増加率"は,第2波と第3波を組み込んだものです。値は,日別感染者数をプロファイルの累計感染者数で除したものに感染惹起期間τを乗じたもので,平均は感染者数の移動平均値(日別ave),増幅率は最適化から得た計算値(日別calc)を,それぞれ累計の計算値で除して算出しています。

τ×平均は実質的な増加率であり,最適化で得られるτ×増加率を追随しています。これは計算モデルが適切であること,モデルが実際を充分に追跡できていることを意味しています。よく見ると,7月下旬の連休で報告される感染者数の減少を反映してτ×増加率を下回り,その直後は報告数の増加を反映して上回るといった具合に,感染者数の変化も表現しています。このような現象は,8月の連休,そして9月の連休でも表れています。
 
図の見方などは,"COVID-19 感染者数プロファイルの計算モデルと見方"もご覧ください。


2020/10/11

COVID-19 東京都の感染者数プロファイルの解析 [10月11日]

COVID-19 東京都の感染者数プロファイルの解析 [10月11日]

Profile analyses of COVID-19 affected numbers in Tokyo [October 11th, 2020]

 
東京都が本日10月11日に発表した感染者数は146名で,9月の連休後の漸増の傾向が続いています。実効再生産数の目安を挙げてブログの図表を改良しました。

前回のブログ(9月30日)に記載した"東京都の感染指数プロファイルの解析"で指摘した傾向が続いていることから,ロジステック関数のプロファイルを追加し,本日までの確定日別の感染者数への追随性を改良しました。8月初めにピークを持つ第2波を3つロジステック関数を用いてプロファイルを解析し,最新日のものとしました。

図1に,日別の感染者数(日別obs),その7日間移動平均値(日別ave),本ブログの解析による日別の感染者数の計算値(日別calc),そして"再生産率"を挙げます。第2波の主要なピークの計算値は7月23日に記した"COVID-19 感染者数プロファイルの計算モデルと見方"のプロファイルとほぼ同じです。
 
図1. 10月11日発表の東京都の確定日別データ(10月10日まで)に基づいています [図をクリックすると拡大]

図1には"再生産率"を載せています。これは"実効再生産数"に相当する値です。ある日付(i)の日別の感染者数をDiとすると,前日からの増加数はDi-Di-1です。感染を惹起する期間(τ: 7日を仮定)に渡って引き起こす感染者数の増減を τ (Di-Di-1)で見積れるならば,期間後の感染者数はDi+τ (Di-Di-1)となります。これを1人当たりの感染者数で除すると1+τ (Di-Di-1)/Diとなり,これを再生産率とします。この再生産率は,1+τ (d2N/dt2)/(dN/dt) とも表現できます(N は累計感染者数,t は時刻)。感染者数としては,実際に報告される日別感染者数,その7日間移動平均値などを適用できますが,あまりにもばらつきが大きいので,日別感染者数の計算値(日別calc)を使用しています。日別calcは,最適化で得られたもので,図1では日別の感染者数のばらつきが除かれており,感染者数への追随が良好ならば,再生産率は感染者数の増大と減少を反映する良い指標となります。

再生産率は,実効再生産数に相当するもので,1よりも大きければ大きいほど感染は拡大し,1よりも小さければ小さいほど収束に向かう傾向が大きくなります。この再生産率は,使用しているデータが累計感染者数のみであること,アルゴリズムが極めて単純なこと,リアルタイム性を有することで,報道される実効再生産数が感染数の報告があってから2~3週間後に判るのに比して,簡便性に優れています。

なお,このブログでは日別の感染者数として"確定日"ごとの値を採用してます。実際の感染者は,確定日の8日程度の前(報道日ベースでは9日程度前)に感染していると考えられ,このブログと図表の日付を8日程度前に移動させて考えると,感染の惹起を理解しやすくなります。この日数の差は,予測ではなく"実際に立脚"する限りは避けられず,また信頼性の源でもあります。

再生産率をみると,第1波では2を超える再生産率で始まり,4月13日(確定日,以下同じ)頃に1.0となって日別感染者数calcのピークに達しました。第1波は5月4日頃に再生産率が最小(0.18)となり,その後は増加に転じました。5月22日頃(非常事態宣言が解除の前)には1を越え,第2波の拡大が始まり,6月13日には最大値1.53に達しました。この値はこのブログで述べた第2波の基本再生産数の相当値に合致します。第2波の拡大に沿って再生産率は低下し始め(あらゆる感染はやがてピークを迎える),8月2日頃(ピーク)には1を切り,8月20日頃には0.77まで低下します。

再生産率は,その後は大きくなり,9月4日頃に1.0を超えて(感染者数では底)増え,以降は1.0+/-0.08の範囲にあります。直近の再生産率は1.0を僅かに超えていますが,感染者数のプロファイルが直近を追随しきれていない可能性があり(10月7日からやや大きな感染者数が現れています),図1の"日別ave"と図2の"τ×平均"には増加の兆しがあるように見受けられます。第1波のピークではその後は速やかに感染者数が減少しましたが,この1月間余りの傾向からは,感染者数がそのピークの状態で減少せずにしばらくは続くと考えられます。

図2. 東京都の感染者数プロファイルの最適化の詳細 [クリックで拡大]
 
第1波のプロファイル,第2波の主要なプロファイル(日別感染者数はD f1 calc),"第2+β波"のプロファイル(D f2 calc)に"第2+γ波"のプロファイル(D f3 calc)も計算に含め,これらを合成した計算値(日別calc)を図1と図2に示しています。感染者数の累計値(累計obs')に計算値を最適化した結果(累計calc')は図2に示してあります(最新の累計感染者数で除して最大値が1となるように規格化した値です)。

図2に東京都の感染者数プロファイルの詳細を示します。第2波についての"τ×平均"と"τ×増加率"は,第2+β波と第2+γ波を組み込んだものです。値は,日別感染者数をプロファイルの累計感染者数で除したものに感染惹起期間τを乗じたもので,平均は感染者数の移動平均値(日別ave),増幅率は最適化から得た計算値(日別calc)を,それぞれ累計の計算値で除して算出しています。

τ×平均は実質的な増加率であり,最適化で得られるτ×増加率を追随しています。ただ,7月下旬の連休で報告された感染者数の減少を反映してτ×増加率を下回り,その直後は報告数の増加を反映して上回るというように,感染者数の変化も表現しています。このような状況は,8月の連休,そして9月の連休でも現れています。ただ,10月に入っての先週の変化はまだ追随しきれていない,あるいは,変化が過度的なものかもしれません。
 
第1波の環境収容力(プロファイル全体の累計感染者数)は5,090,変曲点は4月13日,基本再生産数相当値は2.0です。主要な第2波の環境収容力は16,860,変曲点は8月1日,基本再生産数相当値は1.53とやはり前回のブログとほぼ同じです。

"第2+β波"は,"第2+γ波"の導入により小さくなり,環境収容力は1,710,変曲点は9月12日,基本再生産数相当値は2.0となりました。"第2+γ波"は,変曲点(ピーク)にはまだ達していませんが,その近くにあります。環境収容力はそのため誤差が大きいのですが10,300と見積もられました。基本再生産数相当値は1.5で,主要な第2波とほぼ同じです。

感染のプロファイルは連続的で,これをロジスティック関数の和というディスクリートな形で表現しています。そのメリットは,感染をいくつかに分けて考えることができる,拡大と収束をモデル化して予測に役立てられることにあります。"第2波"と"第2+β波"は既に収束状態にあり,現在は"第2+γ波"が大部分を占める状態にあることになります(図2)。

"第2+β波"と"第2+γ波"はこれまでに5,890の累計感染者を生じ,既に第1波を凌いでします。この2つのプロファイルを合わせると,12,000の累計感染者数が見込まれ,第1波の2倍を超える大きな数です。"第2+γ波"を第3波と呼んだほうが適切かもしれません。

図の見方は,以下,あるいは,COVID-19 感染者数プロファイルの計算モデルと見方"をご覧ください。

感染者数のプロファイルを,日別の感染者数と再生産率を用いると,感染者数の増減を表現できます。その基となっているのは個別のプロファイルの環境収容力,変曲点と内的自然増加率(感染惹起期間を乗じて基本再生産数相当値を算出できます)の3つの定数です。このブログでは,累計感染者数からこれら3つの定数の組を求めています。データは報道される日々の感染者数,計算は簡単なもの(単純なMS Excelシート1枚)で,仮定はただ一つ(ロジスティック関数でプロファイルをよく近似できる)です。感染者の検診の状態,スパイク状に現れるクラスター由来の数,週内の変動,休日などの影響などは特に考慮せずに,そのままの報道数ですべて解析しています(データ点の重みと個別のプロファイルは調節しています)。このブログの内容は私のオリジナルなもので(私の知る限りでは),当然のこととして他者による検証は為されていませんし,結果を保証するものでもありません。パブリック・ドメインのものとして,自由に引用し,あるいは内容を独自に発展させてもかまいません。
 

グラフの見方


感染確定日データの日別の感染者数の累計が,"累計obs"です。ただし,最新の値で割って,最大値が1となるようにした"累計obs'"をグラフにプロットしています。

累計obsに合致するようにロジスティック関数を最適化し,最適化した関数による計算値が"累計calc"です。この値を最新の累計obsで割った"累計obs'"と"累計calc'"をプロットしています。最新の"累計obs'"は1です。

"日別obs"は,日別の感染者数です。最適化した関数から計算される日別の感染者数が"日別calc"です。

最適化した関数から計算される内的自然増加率 r から計算される実効再生産数が,"τ×増加率"です。ここでの τ (tau) は,感染者が感染させてしまう平均日数で,値は7を採用しています。初期の頃の"τ×増加率"に1を加えた数が基本再生産数に対応すると考えられ,東京都の第1波では2,第2波では1.55程度です。

日別の感染者数から見積もることができる"τ×増加率"に相当する値について,素のデータが曜日ごとのばらつきが大きいため,7日間の移動平均をとった値が"τ×平均"です。第1波について"τ×平均1",第2波について"τ×平均2"としています。最新の3日間では7日間移動平均が適用できませんが,動向を把握するために,最新日は実際の値そのもの,前日では3日間の,前々日では5日間の移動平均を採用しています。そのため,最新日と前日の値の変動の幅は大きくなっています。

これら"τ×平均"は関数モデルが妥当ならば,"τ×増加率"に次第に合致するはずです。"τ×平均1"は第1波の"τ×増加率"によく沿っていて,"τ×平均2"は変化しながらも第2波の"τ×増加率"に追随しています。

"累計calc'""日別calc""τ×増加率"は日付を指定すれば計算できるので,数日後の値もプロットしています。

日別感染者数がピークに達するとき,"日別calc""τ×増加率"は変曲点に来ます。変曲点に来ると"τ×増加率"が初めのころの値の1/2となります。"τ×増加率""τ×平均"が次第に小さくなって,半分となる時期が感染のピークです。このときの累計感染者数を2倍すると,最大値になります。

"日別calc"はピークを挟んでグラフでは左右対称となります(偶関数です)。ピークの前と後では日別感染者数,および,その累計値(こちらは奇関数)はほとんど同じ値になります。