主题:【原创】选择抗疫模式的一个可能决策依据(知己知彼,百战不殆) -- 学步桥
河里一个长期的话题就是如何选择抗疫策略,常常吵得不可开交。但是在选择之前,一个重要的因素,就是对采取不同策略的后果进行正确,准确的估计。但是由于技术和各种资源限制,直接去获取这个存在困难。这里我给大家介绍一篇今年早些时候发表在《柳叶刀》的文章:Estimating excess mortality due to the COVID-19 pandemic: a systematic analysis of COVID-19-related mortality, 2020–21
作者是一个集体COVID-19 Excess Mortality Collaborators,领头的是王海东,一位在美国的华人,北大本硕,美国博士,美国工作。
对超额死亡估计的文章汗牛充栋,为什么拿这篇来说事呢,一方面是参与者众多,数据比较充分;另一方面是方法比较可靠。我说一下我觉得比较重要的因素,大家有兴趣可以看原文:
1 对延迟统计,未注册的全因死亡数据进行了矫正。并且剔除了因热浪袭击导致大量死亡的数据。再好的模型也不能在错误数据上做出好结果。这些举措很重要。
2 文中采取了多个模型,分别利用2019.2以前数据对3.2019-2.2020进行估计,然后拿实际数据去打分,根据估计的成绩来做权重,用在对1.2020-12.2021的超额死亡估计上,数据是这之前(上至)11年的历史数据。
关于中国数据,该文估计中国十万人超额死亡在湖北是9.4,湖北之外是0.3,综合是0.6。超额死亡跟实际报告人数比,湖北是2.34倍,其他地方23.57倍,综合是3.71倍。总的来说,我们的抗疫成绩很好,但是统计部门还是差点意思(不一定都是技术原因)。这个对比可以从下面两幅世界地图上清晰看到。前一张是超额死亡数据的世界地图,后一张是和实际报告死亡人数的差距倍数的世界地图。
我个人的理解,对于从已知数据推断未知数据,就是要先寻找“变化中的不变性”(引号内是一位老先生的名言)。这个不变性可能不仅仅是简单的恒常性,甚至可能不是线性。
所以从历史的死亡人口估计没有特定新因素影响下的预期死亡人口才有了不同的模型,他们对于“不变性”是有不同的理解的。而细化的输入,可以让模型预期的不变性更接近真实世界。比如假设《每个人死亡概率一样》就没有假设《每个同年龄的人死亡概率一样》精确,后者又没有假设《每个同年龄且同收入的人死亡概率一样》精确。
但越精确的模型,需要输入数据越精细。主贴的引文因为要全球比较,未必有条件得到非常详细的数据,如人口中年龄、收入、基础疾病、医疗水平等等分布情况。很多网友提出,第一年基础病严重的脆弱人群已经死了,第二年数据就不一样,就算是一个例子。在有限数据下,主贴引文中的处理,就是引入多个模型,对一些数据估计后根据估计的好坏进行加权平均,思路简单但是确实有不少优点。
现在很多网友在根据数据估计差额死亡,我建议大家参考一下该文的方法,而不是简单认为每年就该死一样多的人,或者每年死的人要走同样的趋势。
To estimate expected mortality, we developed six models, each fit separately by location. The first four models were based on first estimating the weekly (or monthly) seasonal pattern of mortality and then estimating the time trend in weekly or monthly mortality not explained by seasonality. We used a Bayesian spline to estimate the weekly seasonal pattern for each location using data from 2010, or the earliest year after 2010 when such data first became available, until around February, 2020, when the COVID-19 pandemic started for each location (appendix p 48). Second, using the same Bayesian spline, we estimated the time trend in the residuals (additional details provided in the appendix, pp 38–40). By combining the seasonal and secular trends, we generated predictions of the expected level of mortality in 2020 and 2021.
The specification of the spline can have a sizeable impact on the estimated expected mortality for a particular location. To make the results more robust to model specification, we included in our ensemble four variants according to where the second to last knot in the spline was placed: 6 months, 12 months, 18 months, and 24 months before the end of the period for the input data before the COVID-19 pandemic started for each location. We also included in the ensemble a Poisson model with fixed effects on week and year, and a model that assumed that expected mortality for 2020 and 2021 was the same as the corresponding weekly mortality observed in 2019. To derive weights for the different models in the ensemble, we assessed how each model performed in an out-of-sample predictive validity test. We fit the model to all data prior to March 1, 2019 and then evaluated how each model performed in predicting mortality between March, 2019, and February, 2020, compared with observed mortality in the same time period. We then weighted component models in the ensemble using 1 over the root mean squared error (RMSE) of the predictions for each component to down-weight component models with larger RMSE (and thus less accurate predictions) in the ensemble. A global weighting scheme was used for all locations. The distribution of RMSE by location for each of the six models included in the model ensemble and examples of the estimated excess mortality for each component model are provided in the appendix (p 49). Expected mortality from the ensemble model was subtracted from observed mortality in 2020 and 2021 to estimate excess mortality due to the COVID-19 pandemic.
接着是另一篇没有正式发表的文章(图中有文章信息,感兴趣的可以搜索,阅读)。主题是讲医疗(准备)水平对抗疫的正面作用。这里一个有意义的数据,是对年龄分布进行矫正后的超额死亡率。这个实际更好反映了抗疫效果,因为一个过渡老龄化国家和年轻人为主的国家比成绩确实不公平。
我们可以看到,我们国家是非常领先的。比我们成绩好的,几乎都有些共同特点:1富裕,医疗发展水平高2岛国,或者人口极其稀疏。可以和我们相比的,还有的就是朝鲜和泰国。
另一个就是该文主要意图,抗疫成绩和医疗(准备)水平的相关性。
首先,我们要承认这个结论是对的,但是这个不奇怪,大家用脚趾头都能想明白,并且同意。其次,这不是全部,一个事情往往有多个因素组成,那么偏离这个拟合线的数据点,就反映了其他因素的影响,距离越大,其他因素占的比重越大。在上面的点表示差的多,在下面表示好的多。如果看数据分布的上缘,除了一些极端国家,比如斯威士兰(一个只有四分之一人口能活过40岁的国家)、莱索托(15-60岁之间死亡的比率为78.65%)大量人口有艾滋病基础;墨西哥、索马里、厄瓜多尔、秘鲁等政府缺乏治理能力外,美国赫然在列。而在数据下沿,也就是非医疗卫生因素起到最重要的作用的国家里,除了极其富裕的岛国,新西兰、新加坡、澳大利亚外,只有中国和朝鲜。
我想上面这些数据的含义指向非常清晰,强大的社会治理能力,对疫情的控制是非常有力,有利的。
另外,泰国的医疗卫生水平居然仅次于美国澳大利亚,全球前三,太出乎意料了。文中有引用来源,看起来还是比较正规的。
图里居然没了。网页上看的时候还有,可能我把图注当成图片本身一部分了。补充如下:
Dowell SF, Wang H and Blazes D. Better pandemic preparedness does correlate with lower COVID-19 mortality [version 1]. Gates Open Res 2022, 6:76 (doi:10.12688/gatesopenres.13649.1)
前面两贴,通过科学数据,验证了我在前面一篇帖子【原创】保持自信,防止自满提到的,中国抗疫成绩非常好的结论。当然,这也不奇怪,大家对此意见基本是一致的。
我想进一步说的,就是我们下一步怎么办,从哪里估计不同措施的后果。我在之前提到,成绩好是过去,将来怎么做,还需要进一步考虑,毕竟成本不可回避。主贴提及的这篇文章除了本身数据外,也提供了一个分析工具。超额死亡,除了新冠直接死亡,也包括了因为医疗挤兑等因为疫情本身引起的间接死亡,也包括抗疫措施带来的经济衰退引起的间接死亡(这个甚至可以是负的,比如澳大利亚,年龄矫正后的中国)。而我国在2020 ,2021 ,2022 甚至每个月情况都有所不同,各个省份也不同,如果分开统计,或许可以做到一个拟合曲线,分离这两个因素,特别是这两个因素随着政府财力的下降,新病毒的传染性加强引起的动态变化。然后根据其他国家不同的防疫政策导致的死亡人数做对比,来选择对自己最有利的决定。我手头没有数据,只是提供一个可能的考察的方向。
我之前的设想,是财政再穷不会穷过朝鲜,或许维持严格的措施最有利。但是后来考虑到新的因素,即我国现在卫生水平比朝鲜高的多,不能硬套。二十年前,中国传染病死亡占比12%,现在传染病死亡占比仅有3%左右。二十年前的寿命和健康寿命仅差3年,现在两者差距9年,意味着慢性病成为更大的死亡风险。现存大量慢性病患者,严格措施对他们的伤害或许大过疫情,这点和朝鲜大不一样。所以最后何种措施最有利,还是要看分时、分地分别测算后,在和国外数据对比的结果。
这仅仅是我粗浅的想法,博大家一笑。
一个是医疗水平第一,一个是老末,连一条线,简直就是绝妙对比。美国的“自由”在朝鲜的“独裁”面前,败了个稀碎。
这数字如果是下降的,那对放开是一个支持,下降越明显支持力度越大
不过之前体质差已经先走了的影响不好评估
卡塔尔世界杯上戴口罩的似乎只有日本女球迷
盖茨看来是个大反贼。麦卡锡何在,此人通朝。
但是私下肯定有分开的数据。甚至拿过来程序自己跑都行,可以精确到月,我们的数据应该是精确到月的。河里有人提到过英国统计部门数据是精确到周。
总的来讲,全因死亡数据算是最不好做假的了,而且作假动机不大。所以我觉得这种方法测算是比较可靠的。
已超额死亡率计,控制比较好的区域集团:
0. 新西兰,澳大利亚,新加坡,中国台湾。富裕岛国,地理上的隔离加上比较好的医疗条件。
1. 东亚、东南亚,应该有重视集体的文化因素,也有比较有力的社会治理的因素。
2. 北欧、加拿大,富裕而且人口稀少,人传人也得先遇到人才行。
3. 非洲部分国家,这个应该就是人口年轻导致的吧,傻小子睡凉炕,全凭火力壮。跟长年累月的饥饿疟疾机关枪比,新冠毛都不算。
另一个统计数据和超额死亡的差异,比较大的国家
1 非洲,应该就是政府能力不行。
2 东亚,能力应该都没问题,估计是儒家文化特有的“耻”,影响了官员的取舍。
3 印度,或许介于上面两者之间。
最后再次感谢你的数据。我就是看了忍不住瞎议论一下,不要见怪。
年龄矫正以后,非洲成绩一落千丈。
从图上的感觉,似乎政府控制力越不行,疫情越糟,感觉这个因素比医疗条件权重还大些。
都传闻在拉美老百姓打疫苗靠毒品集团,政府反而靠不住,没准是真的。
生活在这样的国家,也太刺激了。每天都是冲关游戏啊。
https://mpidr.shinyapps.io/stmortality/
https://www.euromomo.eu/
https://ourworldindata.org/coronavirus#explore-the-global-situation
这是我回复楼主时候另一个帖子里发的:谢谢分享,我分享下方便查询最新数据的网站
- 待认可未通过。偏要看
这些年,钱都被资本家集中了,政府当然也收了一些,但是并非大数在政府,通过疯狂投资又出去了。
这促进了虚假繁荣。
11月23日0—24时,31个省(自治区、直辖市)和新疆生产建设兵团报告新增确诊病例4010例。
31个省(自治区、直辖市)和新疆生产建设兵团报告新增无症状感染者27646例
截至11月23日24时,据31个省(自治区、直辖市)和新疆生产建设兵团报告,现有确诊病例26813例(其中重症病例116例)
从以上数据可知,1,确诊病例在感染者中占比约为15%;2,而重症患者占确诊者比例约为千分之四。
也就是说,按照目前的比例,假如有1亿感染者,确诊病例则为1500万,重症患者为6万人,假如有5亿人感染,则重症患者为30万人,假如有10亿人感染,则重症患者为60万人。
算账完毕。
假如现在全面放开的话,那么首要考虑的问题是,重症病床,也就是ICU床位够不够?定点医院够不够?目前全国定点医院约1500家,每家约400个床位,计60万个床位,其中ICU床位仅占2%,与卫健委要求的定点医院ICU床位不少于10%相差甚远。
接来来要考虑的是,情况会不会变化?奥密克戎如果大范围的在中国人人体上传播(人种不同,疫苗不同),会不会发生新的变异?奥密克戎虽然这一年没有大的变异,但再经历一个冬天,会不会有新的变异?这都是未知数,谁也不敢拍胸脯。如果,情况发生变化,目前的比例发生大的改变,重症患者比例大幅上升,那么,前面算的账都是白瞎,等待中国人的就是一场大灾难。
第三,中国由于人口众多,地域辽阔,各地情况千差万别,所以一管就死,一放就乱是中国国情最大的特色,也总是屡试不爽。目前国际处于百年未有之大变局,老美又在千方百计试图搞死我们,决不能自乱阵脚。
综上考虑,目前最稳妥之策,仍然是精准防控,就像过去偷自来水那样,让水龙头一点一点的滴,让疫情始终在可控、可承受的小范围之内,缓慢增加,留出时间和变化进程,第一,做好全面放开的各种准备,第二,消除人们对病毒的恐慌心理,第三,积攒足够的感染样本,再观察一个冬天。