2020/07/07

COVID-19 東京都の感染者数プロファイルの解析 [7月7日]

COVID-19 東京都の感染者数プロファイルの解析

[7月7日]

Profile analyses of COVID-19 affected numbers in Tokyo [July 7, 2020]


本日7月7日発表分のデータの解析結果です。東京都発表の確定日別のデータは7月6日までの106名でした。そのうち,7月6日は感染数が71名と少なくなっていますが,7月5日は90名,4日は129名へと増えました。

7月5日と6日分の感染者数が少なかったため,矢印で示す"τ×平均2"値は小さくなりました。いわゆる"夜の街"が最近の感染者の4割程度との指摘があります。"夜の街"の影響が少なくなると値が0.3よりも小さくなると思われ,この傾向が続いて欲しいものです。

計算,理論,説明などは,7月2日分(7月3日にアップ)をご覧ください。改訂してあります。

"τ×平均2"が,"τ×増加率"よりも小さい(下方の)時は収束の傾向(実効再生産数が減少),大きい(上方の)時はいっそう拡大の傾向(実効再生産数が増大)を意味しています。なお,"τ×増加率"自体も日々のデータに応じた最適化により,更新されていることにご注意ください。

これまでの傾向から,最近の"τ×増加率"も大きくなっています。5月28日頃の"τ×平均2"が大きくなっていますが,分母となるこの頃の累計数が最適化に伴って小さくなったためです。プロファイルの初期は分母が小さいため,比較的変動が目立ちます。なお,本日分の図では,分子の感染者数から別の関数プロファイルから計算される寄与を差し引いて,改良しています。もちろん,同じ時期の"τ×平均1"も同様に対応しています。
7月7日発表の東京都の確定日別データ(7月6日まで)に基づいています(図は改良版)。

2020/07/06

COVID-19 東京都の感染者数プロファイルの解析 [7月6日]

COVID-19 東京都の感染者数プロファイルの解析

[7月6日]

Profile analyses of COVID-19 affected numbers in Tokyo [July 6, 2020]


本日7月6日発表分のデータの解析結果です。東京都発表の確定日別のデータは7月5日までの102名でした。そのうち,7月5日は感染数が69名と少なくなっていますが,7月4日は119名と33名もの追加増となりました。月曜日の発表では日曜日の確定数で数が少ない傾向があります。

計算,理論,説明などは,7月2日分(7月3日にアップ)をご覧ください。改訂してあります。

矢印で示す"τ×平均2"に注目です。この値が,"τ×増加率"よりも小さい(下方の)時は収束の傾向(実効再生産数が減少),大きい(上方の)時はいっそう拡大の傾向(実効再生産数が増大)を意味しています。なお,"増加率"自体も日々のデータに応じた最適化により、更新されていることにご注意ください。

7月5日分の感染者数が少なかったため"τ×平均2"値は小さくなりましたが,前日までの4日間は約0.5と,大きな値となっています。

これまでの傾向から,"τ×増加率"も大きくなっています。この値が半分の0.24近くまで低下して現在のプロファイルはやっとピークを迎えます。そのときまでの累計感染者数の2倍がこのプロフファイルの全累計感染者数になります。5月22日から既に1,800名の累計感染者数となっています。のまま経過すると,全累計感染者数は第1波の約5,000名を越えそうです。
7月6日発表の東京都の確定日別データ(7月5日まで)に基づいています。

2020/07/05

COVID-19 東京都の感染者数プロファイルの解析 [7月5日]

COVID-19 東京都の感染者数プロファイルの解析

[7月5日]

Profile analyses of COVID-19 affected numbers in Tokyo [July 5, 2020]


本日7月5日発表分のデータの解析結果です。東京都発表の確定日別のデータは7月4日までの110名でした。そのうち,7月4日は感染数が86名と少なくなっていますが,7月3日は137名と23名の追加増となりました。なお,日曜日と月曜日の発表では数が少ない傾向がありますので,ご留意ください。

計算,理論,説明などは,7月2日分(7月3日にアップ)をご覧ください。改訂してあります。

矢印で示す"τ×平均2"に注目です。この値が,"τ×増加率"よりも小さい(下方の)時は収束の傾向(実効再生産数が減少),大きい(上方の)時はいっそう拡大の傾向(実効再生産数が増大)を意味しています。なお,"増加率"自体も日々のデータに応じた最適化により、更新されていることにご注意ください。

7月4日分の数が大幅に少なくなったことがあって"τ×平均2"は小さくなりました。前日までの3日間の大きな値が,6月11日の頃のように一時的なものか,それとも新たな局面を示唆するのかに注目です。

これまでの傾向から,"τ×増加率"も大きくなっています。このまま経過すると,累計の感染者数は,数日前に想定された数よりもかなり増えそうです。
7月5日発表の東京都の確定日別データ(7月4日まで)に基づいています。

2020/07/04

COVID-19 東京都の感染者数プロファイルの解析 [7月4日]

COVID-19 東京都の感染者数プロファイルの解析

[7月4日]

Profile analyses of COVID-19 affected numbers in Tokyo [July 4, 2020]


本日7月4日発表分のデータの解析結果(改訂版)です。東京都発表の確定日別のデータは7月3日までで,その前の数日分も更新(増加)となっています。

計算,理論,説明などは,7月2日分(7月3日にアップ)をご覧ください。

矢印で示す"τ×平均2"に注目です。この値が,"τ×増加率"よりも小さい(下方の)時は収束の傾向(実効再生産数が減少),大きい(上方の)時はいっそう拡大の傾向(実効再生産数が増大)を意味しています。ここでは,感染能を保持する期間τ: tauを7日間としています。なお,"増加率"自体も日々のデータに応じた最適化により、更新されていることにご注意ください。

"τ×平均"は採用しているモデルにはほとんど依存しない,感染プロファイルに固有の指標です。最新の"τ×平均2"を最近の傾向と比較するため,"τ×平均1"の3月19日から25日までの値もグラフに示しました。上昇傾向が続いてから折れ曲がると,新しい局面となったと考えることができます。ここ3日間の大きな値が,6月11日の頃のように一時的なものか,それとも新たな局面を示唆するのかに注目です。

"K値を厳密に取扱う"で明らかにしたように,7日間の時間遅れの特性のため,K値は"τ×平均2"を遅れて追随するものとなっていて,ここ数日間の増加の傾向をあまり反映していませんやはり本ブログのような使用(多分に他の多くの目的)には向いていないようです。
7月4日発表の東京都発表の確定日別データ(7月3日まで)に基づいています(改訂版)。

2020/07/03

COVID-19 東京都の感染者数プロファイルの解析 [7月3日]

COVID-19 東京都の感染者数プロファイルの解析

[7月3日]

Profile analyses of COVID-19 affected numbers in Tokyo [July 3, 2020: No. 2]


本日7月3日発表分のデータの解析結果です。東京都発表の確定日別のデータは7月2日までで,その前の数日分も更新(増加)となっています。

計算,理論,説明などは,7月2日分(7月3日にアップ)をご覧ください。

矢印で示す"移動平均'×7"に注目です。"移動平均'×7"が,これまでの増加の傾向と比較して,"増加率×7"よりも小さい(下方の)時は収束の傾向,"増加率×7"よりも大きい(上方の)時はいっそう拡大の傾向を意味しています。

7月3日の東京都発表の確定日別データに基づいています。

 

COVID-19 東京都の感染者数プロファイルの解析 [7月2日]


COVID-19 東京都の感染者数プロファイルの解析


Profile analyses of COVID-19 affected numbers in Tokyo [July 3, 2020]


SIコンパートメント・モデルに対応するロジスティック関数を用いて,東京都の確定日別の累計感染者数を解析します。

使用しているデータは,東京都の公開データ "確定日別による陽性者数の推移"の累計陽性者数のみです(https://stopcovid19.metro.tokyo.lg.jp/?tab=reference)。陽性者を感染者とし,日別の感染者数は,当日の累計数から前日の累計数を差し引いた増分値としています。

採用したモデルでは,累計者数は複数のロジスティック関数の和とし、ここでは2個の関数の和としています。報告されている累計者数にモデルの関数ができるだけ合致するように,関数を最適化しています。

累計者数とモデルによる累計数は,図に表す上で,最新の累計者数(最大値)で除して,それぞれ累計obs'と累計calc'としています。最新の累計obs'1です。

1を見ると,累計obs'と累計calc'がよく重なって,モデルとその最適化が適切であることを表しいてます。

増分値を累計数で除した値の7日間移動平均を7倍した値(先のブログで述べたm7値)を,"移動平均'×7"として図示しています。ただし,分母の累計数は,報告値のばらつきを低減するため,最適化で求めた各関数の累計数に置き換えています(平均化については後述を参照)。

"移動平均'×7"は,ここで採用している,SIモデルなど,モデル関数にはほとんど依存しない,感染プロファイルの固有の特性を表します。一方,図には先のブログで述べた,モデルから算出される τm値(COVID-19では実効再生産数の目安となる)を"増加率×7"として挙げました。"移動平均'×7""増加率×7"はほぼ対応しているといえます。このことは,採用したSIモデルと解析の妥当性を証明するものです。

"移動平均'×7"が,"増加率×7"よりも小さい(下方の)時は,これまでの増加の傾向と比較して,収束の傾向,"増加率×7"よりも大きい(上方の)時はいっそう拡大の傾向を意味します。

7月4日以降では,取扱いに一般性を持たせるために,"移動平均'×7"を"τ×平均"に,"増加率×7"を"τ×増加率"に変更しています(後述があります)。
Fig.1 東京都の感染者数: データ(obs)と計算値(calc) [July 2nd]

K値の挙動


最近のK値も図示しましたが,先の"K値を厳密に取り扱う"で指摘したように,"移動平均'×7"とはぼ同じ挙動となっていますが,ほぼ7日間の遅れ7日前の挙動)となっていて,ここ数日の感染者数の増加を表すことはできていないように見えます(図の矢印の先)。

1には,日別の感染者数を"日別obs",モデル関数を時間で微分した計算値を"日別calc"として,共に挙げました。日別の感染者数には大きなばらつきがありますが,そのプロファイルの様相を計算値はよく表現できています。"移動平均'×7"は日別の感染者数の変化も反映しています。ただし,移動平均の取り方の制限から,最新3日間の取り扱いはその前方とは異なっています。

解析処理


ここでの最適化に用いたパラメータはわずか6個,2組のPrTだけです。解析処理も単純ストレートなものです。これまでのデータに含まれている様々な事象(さまざまな事柄,人々の営み,...)を語ることができるものではありません。そして,過去のデータから将来を予測はできません。しかし,何かが起きていた,傾向が変わってきたことは定量的に把握できます。このことが,将来の取り組みに何らかの寄与をもたらすことができればと望みます。

ここでのデータは,7月2日公表の7月1日までに判明した確定日別の陽性者数です。このデータでは,確定日が判明していない陽性者数が後日追加されて行くというものです。そのため,最新の数日については,その後の発表の都度,数が相当数増えていきます。

今後の推移に注目しましょう。
 

移動平均の取り扱い


"移動平均'×7"は先のブログのm7に相当します。m値自体はある特定の日の値として定義しています。移動平均は,報告データのばらつき(曜日や休日によって検査と集計に偏りが生じています)を単に低減するための操作です。平均化によって意味のある変動がスムーズアウトされることはあり得ます。乗数7は実効再生産数と対比させるための時間日数でもあります。

ここでは,移動平均の累計数は,図示する範囲の10日ほど前の日を基準日とし,その日の値を以降の累計数から減じてから,平均値を算出しています。これは,感染の初期の累計数が小さいために大きなばらつきを示してしまうからです。この基準日の選択の任意性は,数日の間のみで,その後の値には影響をほほとんど及ばさなくなります。K値についても同じ基準値の操作を適用しました。

7月4日以降は,移動平均の分母の累計数としては,各関数から計算される累計数を用いたものに変更しました。この累計数は小さな値から連続的に増大するため,基準日の取り扱いは無くなり,基準日の恣意性が無くなって一般性も向上しています

7日間移動平均は,ある日と前後3日間の平均としています。ただし,最新の日とその2日前までについては,最新の日は当日の値,その1日前は3日間移動平均値,2日前は5日間移動平均値としています。これら日々のばらつきは大きくなりますが,最新の兆候を反映し易くなります。もちろん,時間の経過とともに7日間移動平均に代わるため,ばらつきは少な目になります。

2020/07/01

K値を厳密に取扱う

K値を厳密に取扱う

Exact K-value expression based on the logistic function

(As of July 1st, 2020)

SIモデルのロジスティック関数を用いて,K値をより厳密に取り扱ってみます。いうまでもなく,K値は特定のモデルや関数形を前提としたものではありません。

先のブログ"K値は実効再生産数の見積もりに役立ちます"より
   N = P/{1+exp[-r(t-T)]}                    1)
   m = r /{1+exp[r(t-T)]}                     4)
です。記号については,先のブログのとおりです。

1つのロジスティック関数で表される感染のプロファイルについて,ある日i の日感染者数Di Ni-Ni-1です(Ni はその日の累計感染者数です)。Di /Ni を日毎の増加率 m として定義し,4)式を導きました。r は内的自然増加率とよばれ,1個体がとりうる最大の増加率,tT は時刻を表しています。以上は補足です[7月8日]。

K値は 1-Ni-7/Ni なので,これに1)式を代入すると
   K= 1-{1+exp[-r(t-T)]}/({1+exp[-r(t-T-7)]}
    = 1-{exp(-7r)+exp[r(t-T-7)}/{1+exp[r(t-T-7)]}
exp(-7r) にマクローリン展開を適用すると,
   K = 1-{[1-7r+(7r)2/2 - (7r)3/6 + ...]+exp[r(t-T-7)}/{1+exp[r(t-T-7)]}
     = 1-{1+exp[r(t-T-7)]+[r-(7r)2/2 + (7r)3/6 - ...]}/{1+exp[r(t-T-7)]}
よって
   K = [7r-(7r)2/2+(7r)3/6- ...]/{1+exp[r(t-T-7)]}      5)
これが厳密な表現です。

7r 1程度で,このように小さいときには2次以降の項を省略して次式が得られます。
   K = 7r /{1+exp[r(t-T-7)]}                    6)
なお,5)式の[7r-(7r)2/2+(7r)3/6- ...]は定数なので,5式と6)式は関数形が全く同じです。

6)式は,m値の4)式を7倍したτm値(τ=7)の式を,時間原点を移動させたものです。時間原点の移動は時間の遅れを意味し,先のブログの図1にもその様子が表れています。この性質は,7日前の日感染者数を累計数で除しているK値の定義からも本質的なものです。

指標としての特性


時間の遅れは,感染の急速な増大期には欠点でしょう。なぜならば,COVID-19パンデミックでは感染数が2日間程度で倍,倍と,1週間で4倍以上に,急速に拡大しているためです。また,感染が顕在化するのに少なくとも数日,さらにそれらが感染数として報告されるには数日,これらを合わせると少なくとも1週間を要するからです。このようなデータを解析した値が7日前の挙動を示しているならば,感染から2週間程度の遅れの結果を意味してしまいます。

一方,感染の収束期には,緩やかに感染者数が減少するので,この欠点はあまり問題になりません。むしろ,1週間の移動平均に相当することから,データのばらつきを低減できるので,指標としては有益です。また,感染プロファイルが継続的な場合,その傾向の変化を把握するうえでも役立ちます。大事なことは,K値の特性をよく把握して活用することです。

先のブログで述べたτm値は過去のデータをすべて反映していて,この値からの偏差には時間の遅れは現れません。また,m7値は,ある日とその前後3日間の日感染者数/累計数の7日間移動平均なので,時間の遅れは平均としては小さいものです。最新の日は当日の値,その1日前は3日間移動平均値,2日前は5日間移動平均値とせざるを得ず,ばらつきは大きくなります。これら数値は,感染可能期間τ値が7日間の場合の実効再生産数に対応しています。
 

日感染者数のデータの発表について


感染数の公表に要する時間は,現在では長すぎます。東京都では,報告数を日単位にまとめた報道発表と,確定日別の日感染者数を別に公表しています。前者は都に報告された数の取りまとめをその日付の数としての発表で,報告自体が数日遅れだったり,数日分をまとめた集計の報告だったりと,統計的な精密さを欠きます。後者はより感染日に近いもので,データ処理の結果も感染モデルとの合致が良好で,時刻パラメータが1日半ほど早くなります。後者はそれでも実際に感染が疑われた日から3-4日後の公表です。

陽性が確定した場合の日時(あるいは検査の着手日時にさかのぼって)がリアルタイムに公表されるならば,感染の推移の解析に役立ちます。もしかしたら,"専門家"にはそのような情報が提供されているのでしょうか?