- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:网络公开数据分析上海疫情封控的超额死亡 -- 夕曦
这个帖子是接续之前的两个帖子:
由于篇幅较长,单独做一个主贴发出来。所有的分析都是基于网络获得的公开数据。
先做一个内容简介:1)张文宏团队近期发表的疫情文章,其公开的基础研究对象数据,可以用来估计上海医疗资源在疫情中被挤占的情况,进一步估计相关的超额死亡;2)超额死亡数据可以与估计的疫情防控措施能够拯救生命的数据做对比;3)通过对比可以找到即保证疫情防控效果,同时又能够有效降低超额死亡最佳比例的策略;4)张文宏疫情文章的其它数据,可以为选择这种策略提供非常有价值的分析,非常遗憾的是这部分数据被浪费了(老兄真把我坑惨了,花了近一天时间才把张网红)。如果合理使用这些数据,今后类似情况下绝大部分的超额死亡是可以避免的。
-----------------------
前面讨论超额死亡研究的基础假设是:在常态下社会提供的医疗资源的总量是相对固定的,围绕这些资源会形成一个动态的供需平衡;就是社会新出现的病例(需求方)与医疗资源(供应方)之间形成一个动态平衡,结果是社会总死亡数在固定时间段内可以保持相对稳定(预期死亡)。
遇到疫情大规模爆发,短时间内快速传播可以产生大量病人,远超正常时期新出现的病例,群体免疫的等躺平疫情对应措施,从需求端打破了医疗资源的动态平衡;同时被感染病人可能长时间占用大量医疗资源(医务人员、病床、病房等),加剧了平衡被打破的状态,产生超额死亡。
在传染病疫情防控中,隔离是通过严格限制人群活动达到阻断疫情传播最极端的一种防控措施(其它措施包括药物、疫苗、个人防护等),实施过程中不可避免地在极大程度上限制了其他疾病患者对医疗资源的正常需求,这是从供应端打破了医疗资源动态平衡,也会产生超额死亡。
疫情爆发中,社会的关注点都被聚焦在感染病例上,聚焦在与西方国家相比我们可以有效减少新冠死亡的成就上,但其他病人因疫情防控措施遭受的痛苦则被忽视了。昨天我一个中学同学转发了前几天收到的房客微信:“房东您好!想和您商量一下是否可以月底付(房租),我们这周刚刚开始(恢复)营业,今年实在太困难了。我母亲在上海疫情期间看不了病自杀了。我父亲急性脑梗,现在还在医院。我回北京就抓紧安排。。。”这是一个不能就医导致的死亡,应该算做新冠疫情封控中的超额死亡。
接触了超额死亡新概念,很自然会产生一些相关问题:与疫情相比,超额死亡真是个(重要)问题吗?超额死亡的规模能够有多大,是否超过疫情本身?
隔离是最极端的一种防控措施,是一把双刃剑,更好的策略是控制传播蔓延的同时兼顾保护其他疾病患者群体。这就需要对可能的超额死亡数目规模进行尽可能合理的评估,与疫情防控挽救生命数字相比较,调整更合理的措施。
使用死亡数据是最直接、有效的方法来研究超额死亡。但目前的国情是死亡数据被严格管控,几乎不可能获得并应用到疫情防控的决策中。或者说政府部门对社会面散发的新冠阳性病例还控制不过来,谁还有时间精力去兼顾看不见摸不到的其他疾病的间接死亡。
老电影台词:“正面攻不破侧面攻”。没有死亡数据直接分析超额死亡,是否还有侧面迂回的方法?
能够想出的侧面迂回方法是:通过分析相对固定医疗资源(比如住院日)被占用的情况,间接评估可能造成的死亡。由于医院设置的病床数是受法律限制、由卫健委相关部门管控的,并且是医院提供医疗服务的主要载体,所以社会上病床总数是非常稳定的、可以用来衡量医疗资源。
我原先一直考虑使用早期研究雾霾时,发表文章中的北京住院数据和死亡数据,来推估上海的住院数据和(预期)死亡数据,再假定不同程度住院日被疫情限制情况,评估相应增加的(超额)死亡数据。这个路径绕的弯较多,而且数据是2006年的,是十几年前的时效性很差,所以一直没有动手。
昨天我们用文献报告的形式讨论了在中国疾控中心属下英文刊物《中国疾病预防控制中心周报》(CHINA CDC WEEKLY)6月18日发表,由上海复旦大学附属华山医院教授张文宏和副院长马昕领衔团队的研究报告,指在今年3月22日至5月3日上海疫情爆发期间(研究时间42天),在33816名早期非重症Omicron感染者中,有22人进展为重症,总体重症率为0.065%,高危组重症率为0.238%,非高危组重症率为零。(Dynamic Disease Manifestations Among Non-Severe COVID-19 Patients Without Unstable Medical Condition)
讨论中发现这篇文章的数据分析中存在有非常多的问题,没有能够充分挖掘数据,没有能对疫情防控提供更有效的信息,我会在后面继续讨论。讨论过程中我忽然有了灵感,可以用开源情报分析方法(Open-source intelligence,OSINT)研究这篇文章提供的公开数据,可以得到比较可靠的疫情期间床位被占用的情况。
在42天研究期间,所有33816名感染者平均病毒释放时间是6天(viral shedding time,VST),也就是从阳性入院到转阴的平均时间是6天。考虑到上海疫情期间判断转阴的标准是大于24小时连续两次核酸检测阴性,可以推定病人的平均住院时间至少是7天。所有病人的总住院天数使用平均住院日计算的结果是:33816 X 7 = 236712天。
文章中说明有上海4家大三甲医院提供数据参与研究,包括上海华山医院,上海第4、6、9人民医院。网上可以查到这些医院设置的病床总数是7608张床,做为正常情况下的医疗资源,4家医院运营42天可为上海病人提供319536个住院日的医疗服务。
疫情期间33816名感染者占用4家医院住院日的比例是:236712/319536 = 74%。这个比例和我几周前向一个上海医生了解的差不多:在疫情期间上海医院面向其他疾病患者开放的床位数不到医院总数的三分之一。
按照2020年《上海市卫生健康统计数据》(2020年上海健康数据)),上海2020年平均住院日11.38天计算,用这些数据计算,33816名感染者相当于挤占了20800名其他疾病病人对这4家大三甲医院的使用。
《上海健康数据》还提供了其它数据,2020年的住院统计是386.97万人次住院,减除因损伤中毒原因的疾病总死亡是20.7万人(按照前十位疾病死亡反向推算)。平均每天10573位新病人需要住院,为保持医疗资源的动态平衡,每天大致有相同数目病人出院(未考虑82.83%的冰川使用率),包括约565人死亡(假设全部疾病死亡发生在住院期间,就是约5.3%的住院病人死亡)。上海疫情4月1号到5月31日两个月封控期间,用以上数据推算,应该有64.5万人次住院,预期疾病死亡34462人。在根据张文宏文章的74%病床位被挤占数据,使用略低的70%病床被挤占的比例估计,整个上海约45.1万其他疾病患者需要住院但在封控期间不能住院。
这个数据可以用来做为估计超额死亡的基础,如果在预期住院病人5.3%死亡基础上,仅仅只有增加1%的超额死亡(总住院死亡率1+5.3%=6.3%),对应的超额死亡可能是4515人;超过预期5%(总住院死亡率10.3%)、10%(总住院死亡率15.3%)、15%(总住院死亡率20.3%)估计的对应超额死亡数据分别是22573、45147、112866人。
从常识上看需要住院治疗患者如果不能住院,死亡风险极高,总死亡率会相当高的,用预期死亡之上10%额外死亡(总住院死亡率15.3%)都应该是相对保守的估计。另外,这仅仅是用住院床位被挤占来估计超额死亡的,还没有考虑其他疾病不能及时得到需要的急诊处理引起的超额死亡。在媒体上有过一些案例报道。比如上海东方医院一名护士突发哮喘,因疫情关闭急诊部,再送其他医院救治耽误了时间,不幸死亡(胡锡进微博);郎咸平证实:因没有核酸报告,母亲未得到及时救治而去世(网易);上海小提琴家陈顺平急症被拒诊后疼痛难忍次日跳楼自杀(网易)。
所以以上用住院日被挤占对上海疫情期间超额死亡的估计都是相对保守的,真实的数据是只能从疫情期间的总死亡数据中直接计算出来的,验证这些估计。
有了对超额死亡数字的估算,可以进一步对比防控措施可以挽救生命损失的数据。截止6月1号,上海累积新冠相关死亡是588人。我们选择用美国马萨诸塞州(JAMA,新冠病毒Delta和 Omicron流行期间马萨诸塞州的超额死亡研究(JAMA超额死亡研究)和香港的2个月奥秘可戎疫情数据对比参考,数据从这个网站获得([URL=网址]Worldometer Coronavirus[/URL])。美国马萨诸塞州人口689万人,在2021年12月17日到2022年2月27日之间新冠死亡2764人,由于躺平地区的新冠筛查率很低,新冠阳性病例统计数据被大大低估,按照上海人口换算后(上海市第七次全国人口普查全市常住人口为24870895人),上海预期新冠死亡9974人,疫情防控挽救约9386人;香港人口762万人,在2022年2月8日到2022年4月8日之间新冠死亡8430人,按照人口换算后上海预期新冠死亡27526人,疫情防控挽救约26938人。
不论是按照美国马萨诸塞州还是香港的躺平疫情防控方式做参照,上海疫情防控挽救生命的数量很可能远远抵不上这些措施导致的超额死亡(用超过预期10%对比)。不论用哪个挽救生命的数据参考,超额死亡都应该是大量实际发生又可以避免的生命损失。
由于不能获得死亡数据,超额死亡只能通过正常状态下的总住院人次与疾病总死亡数据,在假设几个因疫情封控增加的死亡比例中估计。正常状态下上海一天的平均疾病死亡565,就已经接近上海这波新冠疫情死亡总数。但即使因疫情封控措施导致不能住院45.1万人次的死亡增加1%,导致的4515人超额死亡也是新冠总死亡的7倍以上。每个城市/地区的医疗资源,都会确定一个大致稳定的总住院人次与疾病总死亡数据,这就是医疗资源的死亡动态平衡的一种表现。对上海公开数据分析的结果,说明医疗资源的死亡动态平衡是非常脆弱、非常容易被打破的。任何重大突发事件,包括战争、疫情、自然灾害、重大污染,都可能从两端打破动态平衡,产生超额死亡。
分析到这里,很自然进一步提出的问题是:是否可以找到即保证疫情防控的效果,同时又能够有效降低超额死亡?
对这个问题的答案也可以从张文宏文章的数据中给出。在33816名感染住院病人中,发现708例疑似肺炎,经过检查最终只确定99例新冠肺炎(包括22名重症患者)。按照国内和国际临床指南,只有进展到肺炎的99例病人才需要住院治疗,所以研究的绝大部分病人白白长期占用了大部分宝贵的医疗资源。如果能够在感染早期准确预测谁是最终可能发展成为肺炎的病人,及时进行分诊,99.7%的低肺炎风险感染病人可以转移到方舱医院护理,这样可以将病床腾出留给需要使用的其他疾病患者,从而极大降低超额死亡。即使保留708例疑似肺炎感染者住院,也可以留出98%的床位给其他疾病患者。
所以张文宏文章的数据是非常有价值的临床大数据,临床流行病学领域已经有非常成熟的统计分析方法,进行肺炎发生的风险分析,用来确定早期选择肺炎高风险感染者的关键风险因素。这些风险因素可以在疫情防控中对感染者进行有效筛查、分诊,通过将绝大部分低肺炎风险感染人群转移到方舱医院,达到保护最有价值医疗资源的目的。上海这波疫情造成的各种损失极大,但这些数据的合理应用,还是极有价值的。最让我吐槽的是,张文宏团队完全浪费了这些宝贵的数据,根本就没有进行有效的风险分析。
在我写这个帖子的过程中,张文宏文章已经被撤回了(赵盛烨:希望相关医生能够进一步确立科学素养、遵从务实精神,在今后撰写出规范的论文),希望能够对这些数据重新进行有效的分析,指导今后的疫情防控。(但是发帖时发现还是可以在网上查到PDF原文)
-----------
通过以上间接分析,可以看出疫情相关超额死亡应该是真实存在的。以前使用总住院人次与疾病总死亡数据只是对超额死亡的一种模拟估计,是不可能非常准确的。这次上海疫情提供的死亡数据可以用来验证这些估计。以上的整个分析过程也说明,通常不被注意并且被严格限制的死亡数据,对疫情防控策略的制定也有重要作用。如果能进一步与临床数据结合,还可以发挥更重大的效用。这个帖子写作过程中最大的收获是,发现有足够的(张文宏团队研究)临床数据,可以通过数据挖掘分析找到最佳的防控策略,将避免绝大部分超额死亡的发生。另外公开死亡数据,还可以极大推动其它临床(询证)医学研究,从长期看可以间接提高整体的医疗水平。
因为之前对超额死亡讨论感觉争议很多,在发帖之前给帖子中提到的中学同学先看了,征求他的想法。他也是学医的,和我不是一个医学院毕业的。以下是讨论最后他的总结想法:
我觉得要以发展的眼光看待这件事。。。
也就是:中国最开始是在什么状况下使用封控这种政策的。。
最开始就是在当时的武汉。当时是面对一种不知名的,高致死率,急性呼吸道传染病。。。都死了几千人了。。。
只能开始封控。。
严格的封控。。
后来发现效果不错。。。
尝到甜头了。。
就在各地推广执行。。。
但是条件和环境都已经发生了巨大的变化。。。
致病端:
病毒多次变异之后,传染性更强,毒性更低,致死率极大降低了。。
感染端:已经大规模打了疫苗,并且已经有很完备的防御工具了。。
还在用最初的这种隔离方式是否妥当,值得大家讨论推敲。
--------
我的回复:是的,完全同意。但一个帖子不可能讨论这么多。
早发现,早隔离,早治疗。如果上海按照原则这个早点封控也不至于封城。
另外虽然新冠的致死率低了,但是致病后恢复期还是很长。而且对于奥密克戎,疫苗的效果打了折扣。后续的变异依然存在不确定性。
真的要算的话,还要算国家在新冠后遗症下整体生产力降低所导致的死亡,不过这个算起来就没完了。
越来越多的证据表明,新冠并非自然产生,而是一个针对全人类的生物战的阴谋。网友”王爷的杂货铺“有个猜测性的阴谋论帖子,值得看看:
当然这种攻击难有实锤,不过逻辑是通顺的,可以参考。
这些讨论数据和方法都没问题,不过都在回避一个关键问题:就是上海疫情为什么走到感染几十万的地步。过去两年中,整个中国大陆只有上海这样。所谓的封控导致超额死亡人数比封控挽救人数大的比较前提都是疫情泛滥,如果疫情不泛滥,那就不存在封控导致超额死亡,这个才是核心问题。
20年2,3月疫情初发,夕河友拍了胸口(形容词)说不可能是有人为因素。今年4月突然出来又大有此乃生物战之意,不知这两年发生了什么事令夕河友发生这么大的变化?又不知夕河友依据什么确信今年疫情会结束?
请教开了再请教个问题:
非典超额死亡问题,不知夕河友能否提供点数据利出处?不然光凭你是专业人员的身份说有就有,难以释疑。学习你的贴子,超额死亡似乎是一个应对新冠的新概念。
如蒙解惑,感谢。
但我想没有,人口的增长和繁荣的腐烂都是瘟疫流行的原因,以后还会有别的瘟疫。
文章中的“超额死亡”问题。我的理解,你使用上海数据,用疫情封控期间可能的死亡人数对比正常时间的死亡人数,方法是通过47天封控期间的新冠病人对医疗资源的挤占(74%的床位占用),反推出其他病人受此影响可能造成的死亡,进而得到“动态清零”策略产生的总死亡人数(政策代价)。我认为对比的前提有问题,疫情发生时不论如何做,都会产生附带损害,因此,对比的对象不应是“正常时间”,而应是“其他策略”(比如躺平)。你举例说了香港、美国(其实还有韩国和现在正折腾着的台湾),在疫情爆发期采用“躺平”策略,同样的也经历了医疗床位的挤占,天数一定也不会短,按你的方法肯定会得出同样的死亡问题,你是否有数据说明此“死亡”少于彼“死亡”?
另外,关于自杀原因,我认为这是难以界定的事儿,比如美国现在枪击致死人数比疫情前增加了,我们能说这就是疫情造成的,进而计入“超额死亡”吗?
论坛本来就是匿名的,没人认证工作证。没有证据支持的,靠ID人设背书的,基本上直接忽略就对了。
我吃个猪肉都要三思的生活水平,在水木清华装上市公司老板都有人信,真有女ID给我站内信求交往。搞得我现在都不好意思上线了。
一是国外可以很容易获得死亡数据,进行研究。没有疫情时,死亡数据可以直接用在疾病研究中治疗效果的追踪评估;在这块研究领域,由于没有数据,中国一直落后一大块,导致中国大部分临床研究只能做风险分析,不能做预后分析。但张文宏团队连风险分析研究都做不好。
二是中国死亡数据是不公开的,对疫情防控来说像是个黑洞。有些话是不好说的,你可以想象一个上千万人口的超大都会,突然之间70%以上的医院床位不能使用,会产生什么后果?以前总在假设是否可以用住院天数加死亡数来间接估计超额死亡,这次上海疫情正好可以提供数据用来验证。
三是由于是间接方法,估计超额死亡肯定不会准确,只能在每个假设时尽可能保守一些。希望今后即使不能公开,国内也可以用死亡数据对上海疫情进行回顾性研究,总结教训应用到今后的疫情防控中。
四是张文宏团队收集的数据非常有价值,没有使用好非常可惜。间接推测国内的死亡数据也没有能够在疫情防控中得到有效使用。
我研究生学习微生物学的学校是美国唯一的军医大学,所有医学生都是军人,教微生物学大课的多是现役军官;同级同专业研究生,4人中有一个是军人,之前是美国德州的一个营长。学校在美国国立卫生研究所对面海军医院的后面,离现在非常出名的德克利特堡半小时车程。
当时应该是美国生物战研究最低潮时期,念书时教授多次提到过,德克利特堡做为著名微生物研究机构,几乎被荒废掉了,主要原因是不再搞生物战研究、没钱了。给我们描述基地内很多设施都被封了,破败不堪。我认识的在国立卫生研究所做博士后的朋友,多次去德克利特堡内合作实验室取试剂,说的也差不多。
美国911后,有大量的科研基金转为支持防备生物战的研究,好像占全部科研基金的三分之一。我们当时讨论后的认知是生物武器不可能做为大规模杀伤武器,只能做恐怖武器使用,就没有申请。
我念书时,冠状病毒对人类还是无害的。这是在2020年初新冠开始爆发时,我不认为有“人为因素”的认知。
后来的改变是去年10月回国后,见到一个国家疾控部门的朋友(代表中国参加生物武器公约谈判),邀请我做她负责期刊的编辑。期刊刚刚发表的一个文章是中科院做的,对网络下载的公开数据进行分析,发现法国08到2012年之间流感病人分离样本测序的结果,与美国一个研究室对冠状病毒修改的核酸片段序列相同。这是我见到的最强有力的间接证据,当时讨论的结论是从美国的应对和流行的结果看,有实验室泄露的可能,但还没有证据证明是主动的生物武器攻击。
所以我的看法有改变,但目前还是不能得出明确的结论。我当时对朋友说的观点是,不论是否真的存在美国恶意研制生物武器,做为大杀器预备。新冠病毒世界大爆发,已知的生物武器都达不到新冠病毒这样的传播效果,这已经证明生物武器对中国体制没有用,生物武器使用肯定伤及自身,比这次新冠对美国的打击还大。美国之前在生物武器的投入,应该是打水漂了。我朋友和期刊的编辑同事都认同。
关于非典超额死亡问题,是当时的一个争论。我学习到一个新概念,但当时不相信会是一个严重问题,苦于没有数据进行讨论。所以后来一直留心看看是否能够收集到数据,可以进行相关分析。2009年得到北京06年的数据做雾霾分析,发现手头不同来源的数据可以整合到一起,间接分析估计超额死亡。之所以对此特别留心,因为是当时几乎不可能同时获得这两个来源的数据,现在看国内的数据使用环境仍然没有多大变化,所以还能给我这个外人有机会说话。如果有改善,国内数据人才早就会大量涌现,轮不到我在这里得瑟了。