新冠疫情进入第三年后半段了。病毒变异了一轮又一轮,疫苗打了一针又一针。今年的奥米克戎,杀伤力究竟怎么样?
美国CDC被认为是最专业的疾病控制和预防机构。可能由于美国在疫情中的表现,有些人会对这个结论表示怀疑,但至少可以肯定的一点是:美国CDC的数据统计和披露是很好的。借助美国CDC的原始死亡统计数据,我带大家看看奥密克戎的威胁究竟如何。
CDC披露新冠死亡数据在:Excess Deaths Associated with COVID-19 (cdc.gov)。公众号不方便贴外部连接,大家输入浏览器搜索即可。界面如下:
![]()
虽然该专题是关于新冠的超额死亡(Excess Deaths),但其实在这个页面,美国CDC提供了全美所有死亡的原始统计数据,并且从几个角度的做了分类(年龄、种族、州、死因等)。这些数据主要来自下图四个数据库,由各州上报:全国和各州的超额死亡估计;每周汇总的各州各年龄死亡数据;每周按死因汇总的各州死亡数据;每周汇总的各州各种族死亡数据:
![]()
这些数据库非常庞大,譬如第四个如果要下载Excel表格,文件有130M大,89万多行:
![]()
当然了,贴心的美国CDC不会让大家辛苦去爬原始数据库(你要想当然也可以,我就干过),它已经提供了可视化工具:
![]()
选择不同角度,就能出现相应的柱状或曲线视图数据统计,非常方便。本文主要就是基于这个可视化“仪表”来讨论。
介绍完工具,下面我们开始整活。
美国CDC的原始死亡数据(注意,是所有死亡数据,不仅仅是新冠)进行了不同的可视化分析分类(前一张图)。我把这些分类归结三种:
(1)原始数据类。这几个数据除了按州、年龄、种族等客观标准分类之外,没有任何人为干预或估算的成分。主要是下面几个:
Weekly Number of Deaths by Age(每周按年龄段的死亡数);
Weekly Number of Deaths by Race/Ethnicity(每周按种族的死亡数);
Change in Number of Deaths by Race/Ethnicity(上两类数据的变化);
(2)超额死亡类。美国CDC超额死亡的定义后面会提到。这一类数据虽然没有前一类那么“原始”,但超额死亡的计算也有一致的客观标准算法,所以这类数据我们着重关注:
Weekly Excess Deaths(每周超额死亡数);
Number of Excess Deaths(超额死亡数,其实和上面一样);
Percent Excess Deaths(超额死亡百分比);
(3)余下的数据,它们多多少少都是按照死因分类的,可以算作为死因归总类。
对于第(3)分类,由于死亡归因很难有统一口径,或者即使有统一口径,执行时的一致性也很难保证。简言之就是对于die of(死于)和die with(死亡时伴有),各州的统计以及不同时间的统计可能都不一样,因此这种分类的人为影响和估算情况很严重。
同时,CDC的正式死因(Cause)是按照临床表现归类(譬如循环系统疾病、呼吸系统疾病、心脏衰竭等等):“Cause of death counts are based on the underlying cause of death, and presented for Respiratory diseases, Circulatory diseases, Malignant neoplasms, and Alzheimer disease and dementia”,这些分类并不能直接用来做新冠的分析。
因此,本文后面只会讨论前两种分类,因为它们几乎没有人为影响或估算的成分。本文不涉及第三种分类,对它感兴趣的同学,可以自行去网页查证。结论和前两类的结果是一致的,甚至更能反映本文的观点。(这里还要说明的是,上面三种分类,只是CDC提供的看数据的不同角度,但它们都是基于同样的原始数据库的)
可能有人会争论:前两类数据是总体死亡数据啊,并不是新冠的数据。
这点我是这么理解的:首先如前述,我们(或者说CDC)很难得出不受人为干扰的“新冠数据”,而总体死亡数据则几乎没有人为干扰。
其次,对于新冠这种大规模疫情来说,总体死亡人数上的变化,其实足够反映病毒威力了,甚至有时会更准确(譬如,新冠病毒感染后免疫力的降低,可能使一位弱者死于其它原因的疾病,这虽然不是直接死于新冠,但显然和新冠分不开)。
我们先看基于种族的每周死亡数字。
下图是美国非拉丁裔白人的死亡总数曲线。非拉丁裔白人可以说是美国的核心种族了:
![]()
各种颜色曲线的代表年份请看上面的原注释。我在图中另外做了些标注:
“原①”指原始毒株在美国造成的第1个死亡高峰,出现在2020年上半年;
“原②”指原始毒株造成的第2个死亡高峰,出现在2020年底至2021年初;
“德”指德尔塔毒株爆发造成的死亡高峰,出现在2021年下半年初始;
“奥”指奥米克戎毒株爆发造成的死亡高峰,出现在2022年上半年。
需要说明的是标了“尾部”那处,也就是2022年紫色曲线临近最近有个向下的趋势。这并不是因为最近的死亡人数显著下降了,而是因为越临近当下,各州上报的数据越不完整或延迟。美国CDC的原话:“This delay can range from 1 week to 8 weeks or more, depending on the jurisdiction and cause of death.(数据延迟可能达1到8周,取决于各州的行为或死因)”。后面很多图都有这样的“尾部”,原因都是一样的。
从美国CDC的原始数据,我们可以得到下面几个直观结论(针对美国非拉丁裔白人):
(1)2022年奥米克戎爆发造成的死亡人数高峰,超过了两波原始毒株和德尔塔毒株。体现为“奥”的峰值要高于“原①”、“原②”、“德”。
(2)各个毒株爆发期过后的平静期,也就是各条曲线的波谷位置,没有明显高低区别。说明各个毒株在平稳期的杀伤力也是差不多的,奥米克戎并不更弱。下图截取了第20-30周的曲线,近三年这个阶段正好是平静期,可以看到:红色(2020年)、黄色(2021年)、紫色(2022年)的三条死亡曲线并无明显的高低之分,甚至2022(紫色)线条还一度最高:
![]()
(3)2020-2022年的死亡曲线,不管是波峰还是波谷,整体都高于2015-2019年的灰色曲线。2015-2019年灰色曲线,可算是正常年份整体死亡的“本底”曲线了,红、黄、紫三条曲线,都明显位于灰色本底曲线之上。
同时还不要忘了一个关键背景:2022年奥密克戎到来时,免疫力不好的那些“老弱病残”在前两年已经被“带走”一大批了。剩余人群相对是免疫力更好的,而且疫苗普及普及状况、自然免疫状况,都比前两年要好。在这些更有利的情况下,奥米克戎爆发时的死亡峰值还高于之前,波谷也并不明显降低。这说明奥米克戎是很“强大”的,不能用“流感”来看待。
下面我们再看看美国第二大族群--黑人--的情况:
![]()
同样可以看出:对美国黑人族裔来说,奥米克戎毒株产生的死亡高峰(图中“奥”),除了低于2020年原始毒株第1波的死亡高峰(图中“原①”),是高于其它爆发期的死亡高峰的,甚至高于德尔塔(图中“德”)爆发后的死亡高峰。
我们再来看看美国亚裔:
![]()
亚裔不愧是防疫的模范民族。可以看到在经过了原始毒株的两次死亡高峰后(“原①”、“原②”),德尔塔居然没有在亚裔中掀起死亡高峰(2021年曲线在二、三两个季度的非常平缓)。但作为对比,亚裔没能逃过奥米克戎毒株,图中“奥”是一个明显的死亡峰值。这说明奥米克戎对美国亚裔的伤害要比德尔塔大得多。同时也可以看到,在历次毒株爆发之后的平静低谷期,几个毒株大致同样温和,也都同样高于灰色的“本底”。
至于美国西班牙裔等其它族裔的情况,基本类似,大家感兴趣的话可以自己去网站看看。
通过美国CDC的原始死亡数据统计,可以合理得出的结论是:奥米克戎爆发期的“杀伤力”并不弱于以前的毒株,有时甚至更强。在感染高峰期过去的平静期,奥米克戎造成的死亡人口也远远高于疫情之前。
下面我们再来看看美国CDC按不同年龄段披露的原始死亡数据。
以下是近三年(2020-2022),以及2015-2019年,25岁以下年龄段的死亡数据:
![]()
可以看出,对25岁以下人口,死亡数据没有太大的波动。这几年的曲线,包括灰色“本底”曲线,都基本糅合在一起。说明各种新冠毒株对年轻人的伤害不大。
但是到了25-44岁的壮年阶段,新冠的威力就体现出来了。可以看到下图2021年德尔塔毒株的死亡峰值(黄色“德”)最高,2022年奥密克戎死亡峰值(紫色“奥”)其次,是强于原始毒株的。并且这个年龄段疫情时的死亡人数,已经显著高于疫情前了(红黄紫三条曲线明显在灰色线之上)。
![]()
在45-64岁阶段,病毒的杀伤力继续走高(大家可以比较前后两张图的纵坐标高度,它表示了死亡峰值的绝对值)。从峰值看,奥米克戎的死亡峰值(“奥”)和德尔塔峰值(“德”)、原始毒株第2个峰值(“原②”)接近,同时高于原始毒株的第一波高峰(“原①”):
![]()
在65-74岁这个“老年中的青年”阶段,可以看到奥米克戎造成的死亡峰值几乎是所有毒株中最高的:
![]()
在75岁以上的高龄人口中,结论同样类似,奥密克戎的杀伤力并没有降低,甚至在最强之列。同时三年疫情期间的绝对死亡人口也比疫情前的平常年份更多:
![]()
![]()
同样如前述,在得出上面结论的同时还不要忘了背景:奥米克戎这样的“杀伤力”,是建立在过去两年老弱病残已经被“带走”了几波、疫苗大规模普及、人群自然感染免疫更普遍的诸多情况下的。这几乎可以说明,奥米克戎从绝对死亡人数的角度来看,“杀伤力”更大。
下面,我们来回到美国CDC本数据库的主题:超额死亡(Excess Death)。
首先,美国CDC对“超额死亡”的定义,本页面有说明。美国CDC超额死亡比较的标准是过去4年。根据过去4年的死亡数据计算出“基准”死亡人数。如果今年实际死亡人数超过了历史“基准”,则多出的部分就是“超额死亡”数。但由于这两年情况特殊,死亡数被疫情影响很大,因此美国CDC在计算历史“基准”时几乎排除了2020年和2021年的数据,同时引入2016和2017年的数据,也就是说,“历史基准”死亡数据,是基于2016-2019年(同时也加上一点标准算法调节人口自然变化)。
简言之,美国CDC定义的超额死亡就是指:和历史上最近4个无大病无大灾的平常年份相比,今年多死了多少人。
我们来看最近几年超额死亡的全貌。下面带红色“+”的蓝柱子,明显超过了历史基准(红黄色带),就表示这些星期发生了超额死亡:
![]()
图中分别标注了:
原①:原始毒株造成的第一个死亡高峰;
原②:原始毒株造成的第二个死亡高峰;
平①:原始毒株大爆发过去后的平静期;
德:德尔塔毒株造成的死亡高峰;
奥:奥米克戎毒株造成的死亡高峰;
平②:奥米克戎大爆发过去后的平静期。
从图中可以看出两个明显结论:
(1)奥米克戎带来的超额死亡峰值,秒杀了原始毒株第一波,也秒杀德尔塔,几乎和原始毒株第二波基本相当。
(2)过去两年的两个大爆发后的平静期,奥米克戎之后的平静期(平②)的超额死亡数明显高于平①。
同时不要忘记了,也是我反复强调的,数据背景:奥米克戎的超额死亡,是建立在过去两年老弱病残已经被病毒“带走”了一波、疫苗已经大规模普及、人群自然感染免疫力更普遍等诸多情况下的。
另外,还有一种说法是:新冠疫情死亡的大多是本身免疫力低下或健康状况不佳的人群,尤其是老年人。即使没有疫情,他们大多也会在这两年自然死亡。因此疫情并不会额外“杀死”多少人,只是让很多老弱病残者“提前离世”。
但CDC的超额死亡数据其实否定了这种观点。因为,如果病毒只是让老弱病残“提前离世”,那么在进入疫情的第三年,尤其是被奥米克戎高峰冲击一波之后,超额死亡应该是负数,因为老弱病残已经变少了。而事实上,奥米克戎以来,超额死亡依然一直为正。也就是说:老弱病残者更少且疫苗更普及的情况下,却死亡了更多人,里外里的差距是不小的。
上面是一点搬运工作,为了不影响大家各自的解读,我不再做更多的点评,尽量呈现的客观一些。感谢美国CDC的原始数据。希望对大家全面理解疫情有帮助。
美国CDC被认为是最专业的疾病控制和预防机构。可能由于美国在疫情中的表现,有些人会对这个结论表示怀疑,但至少可以肯定的一点是:美国CDC的数据统计和披露是很好的。借助美国CDC的原始死亡统计数据,我带大家看看奥密克戎的威胁究竟如何。
CDC披露新冠死亡数据在:Excess Deaths Associated with COVID-19 (cdc.gov)。公众号不方便贴外部连接,大家输入浏览器搜索即可。界面如下:
虽然该专题是关于新冠的超额死亡(Excess Deaths),但其实在这个页面,美国CDC提供了全美所有死亡的原始统计数据,并且从几个角度的做了分类(年龄、种族、州、死因等)。这些数据主要来自下图四个数据库,由各州上报:全国和各州的超额死亡估计;每周汇总的各州各年龄死亡数据;每周按死因汇总的各州死亡数据;每周汇总的各州各种族死亡数据:
这些数据库非常庞大,譬如第四个如果要下载Excel表格,文件有130M大,89万多行:
当然了,贴心的美国CDC不会让大家辛苦去爬原始数据库(你要想当然也可以,我就干过),它已经提供了可视化工具:
选择不同角度,就能出现相应的柱状或曲线视图数据统计,非常方便。本文主要就是基于这个可视化“仪表”来讨论。
介绍完工具,下面我们开始整活。
美国CDC的原始死亡数据(注意,是所有死亡数据,不仅仅是新冠)进行了不同的可视化分析分类(前一张图)。我把这些分类归结三种:
(1)原始数据类。这几个数据除了按州、年龄、种族等客观标准分类之外,没有任何人为干预或估算的成分。主要是下面几个:
Weekly Number of Deaths by Age(每周按年龄段的死亡数);
Weekly Number of Deaths by Race/Ethnicity(每周按种族的死亡数);
Change in Number of Deaths by Race/Ethnicity(上两类数据的变化);
(2)超额死亡类。美国CDC超额死亡的定义后面会提到。这一类数据虽然没有前一类那么“原始”,但超额死亡的计算也有一致的客观标准算法,所以这类数据我们着重关注:
Weekly Excess Deaths(每周超额死亡数);
Number of Excess Deaths(超额死亡数,其实和上面一样);
Percent Excess Deaths(超额死亡百分比);
(3)余下的数据,它们多多少少都是按照死因分类的,可以算作为死因归总类。
对于第(3)分类,由于死亡归因很难有统一口径,或者即使有统一口径,执行时的一致性也很难保证。简言之就是对于die of(死于)和die with(死亡时伴有),各州的统计以及不同时间的统计可能都不一样,因此这种分类的人为影响和估算情况很严重。
同时,CDC的正式死因(Cause)是按照临床表现归类(譬如循环系统疾病、呼吸系统疾病、心脏衰竭等等):“Cause of death counts are based on the underlying cause of death, and presented for Respiratory diseases, Circulatory diseases, Malignant neoplasms, and Alzheimer disease and dementia”,这些分类并不能直接用来做新冠的分析。
因此,本文后面只会讨论前两种分类,因为它们几乎没有人为影响或估算的成分。本文不涉及第三种分类,对它感兴趣的同学,可以自行去网页查证。结论和前两类的结果是一致的,甚至更能反映本文的观点。(这里还要说明的是,上面三种分类,只是CDC提供的看数据的不同角度,但它们都是基于同样的原始数据库的)
可能有人会争论:前两类数据是总体死亡数据啊,并不是新冠的数据。
这点我是这么理解的:首先如前述,我们(或者说CDC)很难得出不受人为干扰的“新冠数据”,而总体死亡数据则几乎没有人为干扰。
其次,对于新冠这种大规模疫情来说,总体死亡人数上的变化,其实足够反映病毒威力了,甚至有时会更准确(譬如,新冠病毒感染后免疫力的降低,可能使一位弱者死于其它原因的疾病,这虽然不是直接死于新冠,但显然和新冠分不开)。
我们先看基于种族的每周死亡数字。
下图是美国非拉丁裔白人的死亡总数曲线。非拉丁裔白人可以说是美国的核心种族了:
各种颜色曲线的代表年份请看上面的原注释。我在图中另外做了些标注:
“原①”指原始毒株在美国造成的第1个死亡高峰,出现在2020年上半年;
“原②”指原始毒株造成的第2个死亡高峰,出现在2020年底至2021年初;
“德”指德尔塔毒株爆发造成的死亡高峰,出现在2021年下半年初始;
“奥”指奥米克戎毒株爆发造成的死亡高峰,出现在2022年上半年。
需要说明的是标了“尾部”那处,也就是2022年紫色曲线临近最近有个向下的趋势。这并不是因为最近的死亡人数显著下降了,而是因为越临近当下,各州上报的数据越不完整或延迟。美国CDC的原话:“This delay can range from 1 week to 8 weeks or more, depending on the jurisdiction and cause of death.(数据延迟可能达1到8周,取决于各州的行为或死因)”。后面很多图都有这样的“尾部”,原因都是一样的。
从美国CDC的原始数据,我们可以得到下面几个直观结论(针对美国非拉丁裔白人):
(1)2022年奥米克戎爆发造成的死亡人数高峰,超过了两波原始毒株和德尔塔毒株。体现为“奥”的峰值要高于“原①”、“原②”、“德”。
(2)各个毒株爆发期过后的平静期,也就是各条曲线的波谷位置,没有明显高低区别。说明各个毒株在平稳期的杀伤力也是差不多的,奥米克戎并不更弱。下图截取了第20-30周的曲线,近三年这个阶段正好是平静期,可以看到:红色(2020年)、黄色(2021年)、紫色(2022年)的三条死亡曲线并无明显的高低之分,甚至2022(紫色)线条还一度最高:
(3)2020-2022年的死亡曲线,不管是波峰还是波谷,整体都高于2015-2019年的灰色曲线。2015-2019年灰色曲线,可算是正常年份整体死亡的“本底”曲线了,红、黄、紫三条曲线,都明显位于灰色本底曲线之上。
同时还不要忘了一个关键背景:2022年奥密克戎到来时,免疫力不好的那些“老弱病残”在前两年已经被“带走”一大批了。剩余人群相对是免疫力更好的,而且疫苗普及普及状况、自然免疫状况,都比前两年要好。在这些更有利的情况下,奥米克戎爆发时的死亡峰值还高于之前,波谷也并不明显降低。这说明奥米克戎是很“强大”的,不能用“流感”来看待。
下面我们再看看美国第二大族群--黑人--的情况:
同样可以看出:对美国黑人族裔来说,奥米克戎毒株产生的死亡高峰(图中“奥”),除了低于2020年原始毒株第1波的死亡高峰(图中“原①”),是高于其它爆发期的死亡高峰的,甚至高于德尔塔(图中“德”)爆发后的死亡高峰。
我们再来看看美国亚裔:
亚裔不愧是防疫的模范民族。可以看到在经过了原始毒株的两次死亡高峰后(“原①”、“原②”),德尔塔居然没有在亚裔中掀起死亡高峰(2021年曲线在二、三两个季度的非常平缓)。但作为对比,亚裔没能逃过奥米克戎毒株,图中“奥”是一个明显的死亡峰值。这说明奥米克戎对美国亚裔的伤害要比德尔塔大得多。同时也可以看到,在历次毒株爆发之后的平静低谷期,几个毒株大致同样温和,也都同样高于灰色的“本底”。
至于美国西班牙裔等其它族裔的情况,基本类似,大家感兴趣的话可以自己去网站看看。
通过美国CDC的原始死亡数据统计,可以合理得出的结论是:奥米克戎爆发期的“杀伤力”并不弱于以前的毒株,有时甚至更强。在感染高峰期过去的平静期,奥米克戎造成的死亡人口也远远高于疫情之前。
下面我们再来看看美国CDC按不同年龄段披露的原始死亡数据。
以下是近三年(2020-2022),以及2015-2019年,25岁以下年龄段的死亡数据:
可以看出,对25岁以下人口,死亡数据没有太大的波动。这几年的曲线,包括灰色“本底”曲线,都基本糅合在一起。说明各种新冠毒株对年轻人的伤害不大。
但是到了25-44岁的壮年阶段,新冠的威力就体现出来了。可以看到下图2021年德尔塔毒株的死亡峰值(黄色“德”)最高,2022年奥密克戎死亡峰值(紫色“奥”)其次,是强于原始毒株的。并且这个年龄段疫情时的死亡人数,已经显著高于疫情前了(红黄紫三条曲线明显在灰色线之上)。
在45-64岁阶段,病毒的杀伤力继续走高(大家可以比较前后两张图的纵坐标高度,它表示了死亡峰值的绝对值)。从峰值看,奥米克戎的死亡峰值(“奥”)和德尔塔峰值(“德”)、原始毒株第2个峰值(“原②”)接近,同时高于原始毒株的第一波高峰(“原①”):
在65-74岁这个“老年中的青年”阶段,可以看到奥米克戎造成的死亡峰值几乎是所有毒株中最高的:
在75岁以上的高龄人口中,结论同样类似,奥密克戎的杀伤力并没有降低,甚至在最强之列。同时三年疫情期间的绝对死亡人口也比疫情前的平常年份更多:
同样如前述,在得出上面结论的同时还不要忘了背景:奥米克戎这样的“杀伤力”,是建立在过去两年老弱病残已经被“带走”了几波、疫苗大规模普及、人群自然感染免疫更普遍的诸多情况下的。这几乎可以说明,奥米克戎从绝对死亡人数的角度来看,“杀伤力”更大。
下面,我们来回到美国CDC本数据库的主题:超额死亡(Excess Death)。
首先,美国CDC对“超额死亡”的定义,本页面有说明。美国CDC超额死亡比较的标准是过去4年。根据过去4年的死亡数据计算出“基准”死亡人数。如果今年实际死亡人数超过了历史“基准”,则多出的部分就是“超额死亡”数。但由于这两年情况特殊,死亡数被疫情影响很大,因此美国CDC在计算历史“基准”时几乎排除了2020年和2021年的数据,同时引入2016和2017年的数据,也就是说,“历史基准”死亡数据,是基于2016-2019年(同时也加上一点标准算法调节人口自然变化)。
简言之,美国CDC定义的超额死亡就是指:和历史上最近4个无大病无大灾的平常年份相比,今年多死了多少人。
我们来看最近几年超额死亡的全貌。下面带红色“+”的蓝柱子,明显超过了历史基准(红黄色带),就表示这些星期发生了超额死亡:
图中分别标注了:
原①:原始毒株造成的第一个死亡高峰;
原②:原始毒株造成的第二个死亡高峰;
平①:原始毒株大爆发过去后的平静期;
德:德尔塔毒株造成的死亡高峰;
奥:奥米克戎毒株造成的死亡高峰;
平②:奥米克戎大爆发过去后的平静期。
从图中可以看出两个明显结论:
(1)奥米克戎带来的超额死亡峰值,秒杀了原始毒株第一波,也秒杀德尔塔,几乎和原始毒株第二波基本相当。
(2)过去两年的两个大爆发后的平静期,奥米克戎之后的平静期(平②)的超额死亡数明显高于平①。
同时不要忘记了,也是我反复强调的,数据背景:奥米克戎的超额死亡,是建立在过去两年老弱病残已经被病毒“带走”了一波、疫苗已经大规模普及、人群自然感染免疫力更普遍等诸多情况下的。
另外,还有一种说法是:新冠疫情死亡的大多是本身免疫力低下或健康状况不佳的人群,尤其是老年人。即使没有疫情,他们大多也会在这两年自然死亡。因此疫情并不会额外“杀死”多少人,只是让很多老弱病残者“提前离世”。
但CDC的超额死亡数据其实否定了这种观点。因为,如果病毒只是让老弱病残“提前离世”,那么在进入疫情的第三年,尤其是被奥米克戎高峰冲击一波之后,超额死亡应该是负数,因为老弱病残已经变少了。而事实上,奥米克戎以来,超额死亡依然一直为正。也就是说:老弱病残者更少且疫苗更普及的情况下,却死亡了更多人,里外里的差距是不小的。
上面是一点搬运工作,为了不影响大家各自的解读,我不再做更多的点评,尽量呈现的客观一些。感谢美国CDC的原始数据。希望对大家全面理解疫情有帮助。