2减1 能不能等于 1? – 新增核减这个数据怎么看

今天,在武汉经历了三天大规模的排查之后,新增病例有了大幅度的下降,数据一下子从连日的一千六百多直接降到了六百多例。但是今天卫健委发布的数据也同时引发了热议。很多网友疑惑为什么国家卫健委通告全国今日新增确诊394例,但仅武汉就新增615例,是不是卫健委算错了?人民日报官微的《武汉新增确诊病例高于湖北全省?这个数据你看懂了吗?》和央视网的《16连降!还有一个数据需要特别解释一下》这两篇推送在朋友圈刷屏。这里我们试图对新增核减的关系做一个详细的分析。

1. 什么是核增、核减

现在每一天,国家卫健委都会发布通告,公布过去的24小时内的新增确诊病例,治愈病例,死亡病例。也会公布相应总量。但是还有一项是不常见的核减。核减是有很多可能。一种是把此前根据先期诊断标准和结果认为是确诊的,后来又复核确认为阴性的去除。例如在20日公布的核减里面,国家卫健委权威意见指出是 “荆门、咸宁等市州对确诊病例中来源于原“临床诊断病例”者进行核酸检测,通过综合分析,将核酸检测结果为阴性的病例从确诊病例中核减,共订正核减279例。”

在各地的公告中,也有的相应的核减情况。注意到的是有的核减是由于病源地的改变。例如北京就在公告中曾经指出“根据国家有关规定,病例归属地原则按发病时的居住地确定”而调整不同区的病例数目。这个时候有的地方就有增有减。看下面在疫情晴雨表可视化里面,我们就可以看到2月8日和2月11日都发生了相应的情况。2月11日是海淀1例调整到了西城。

2. 调减(调增)是对过去病例的调整

注意到这里,所谓的调减(调增)都是对过去的病例的变更,这也是体现了卫健委系统对于数据的严肃性。但是这个调减并不是对当天新出现的病例的调整。为了更好地理解这个过程。我们做了一个简单的动画。

看了这个动画,我们就可以理解,当天的新增数覆盖的病例和调减的对象是不一样。

3. 寻根探源看算法

到这里,我们可以更仔细来看看卫健委公布的数据。国家卫健委2月14日发布的《截至2月13日24时新型冠状病毒肺炎疫情最新情况》通告显示:2月13日0—24时,31个省(自治区、直辖市)和新疆生产建设兵团报告新增确诊病例5090例,累计报告确诊病例63851例(湖北省核减1043例)。根据截至2月12日24时数据,全国(不含港澳台)累计报告确诊病例59804例,可见新增确诊数未与核减数相抵消,即今日累计值=昨日累计值+新增值+核减值(正数为核增、负数核减)。

在国家卫健委2月14日后发布的通告中,统计口径发生变化。《截至2月14日24时新型冠状病毒肺炎疫情最新情况》通告:2月14日0—24时,31个省(自治区、直辖市)和新疆生产建设兵团报告新增确诊病例2641例,累计报告确诊病例66492例,其中湖北新增确诊病例2420例,并未公布核减或核增的情况,但我们从当天湖北省卫健委的通告中发现:“2020年2月14日0—24时,湖北省新增新冠肺炎病例2420例(含临床诊断病例1138例、核减前一日临床诊断病例22例)”,即湖北省当日实际新增应为2442例,核减22例。在这个时间点后新增确诊病例数变成新增确诊数与核减数抵消后的“净增长值”。

我们再看后一天的通告:2月15日0—24时,31个省(自治区、直辖市)和新疆生产建设兵团报告新增确诊病例2009例,累计报告确诊病例68500例(江西省核减1例),经过简单的计算,66492+2009-1=68500,似乎仍是2月14日前的算法。

我们带着疑问查找湖北省卫健委官网,发现湖北省当日新增新冠肺炎确诊病例1843例,与国家卫健委通告相同,但湖北宜昌市也有核减5例,这在国家卫健委的通告中并未体现。根据接下来2月16日-2月19日的通告内容,我们总结出:国家卫健委汇总的全国新增确诊病例数,为全国各省实际新增确诊病例数加湖北的核减数(正数为核增、负数核减)。或者另外的一个解读,国家卫健委可能是根据各地卫健委的数字来相加核算的,湖北的方法在一个时间点有了改变。

4. 面对难题怎么办?

前面我们提到,各地卫健委通报中的核减或核增病例,并不是当日实际新增的确诊病例,由于无法明确该病例是何日被确诊,在逻辑上并不能与当日实际新增值抵消。

我们在这段时间发布了一些疫情的可视化工具,也需要用到准确的数据。因此在我们数据收集的过程中,根据国家卫健委和各省卫健委的通告,计算出实际确诊病例数,并将“核减”与“核增”单独列出,以示区别。这样我们显示的数据就可以和卫健委的官方数据一致了。

在疫情晴雨表用方块下方数字表示当日实际新增确诊病例数。括号内的数字为当日核减、核增病例数。在疫情晴雨表的右侧,展示该地区的累计确诊数,利用上述算法的结果与卫健委公示的最新累计值一致。
(网址:http://vis.pku.edu.cn/ncov/barometer/

关于卫健委公示的病例归属调整,我们也利用上述“核增”与“核减”的概念处理,例如《2020年2月9日江西省新型冠状病毒肺炎疫情情况》通告:确诊病例中,南昌市189例(1例划归赣江新区),我们将这种情况定义为南昌市核增1例,赣江新区核减1例,该统计方法能正确反映与事实相符的情况。

值得一提的是,许多实时数据平台并未考虑核增与核减的情况,仅通过简单的差值处理将最新累计病例数减昨日累计病例数,获得新增病例数,并不符合真实情况。我们已经整理了根据上述规则收集的数据,将很快公开给有兴趣的人士使用。同时也将公布详细的技术处理文档。请大家关注。

5. 一点建议

北京大学可视化与可视分析实验室自新冠病毒肺炎疫情爆发起,一直关注着卫健委发布的每日疫情通告。在和很多兄弟院校老师同学一起整理数据过程中,我们尽量根据自己的理解,去解决遇到的问题,制定了明确的处理规范和数据统计方法。

我们理解在疫情压力巨大的情况下,各地可能发布有一些不同。但是如果能够有一个各位一致的数据统计公布方法,对于公众了解疫情和学者利用相关数据开展计算研究是有很大帮助的。如果直接减去核减病例数来计算公布新增病例,在最终数目上是一致的,但是也容易引起公众误解,特别是在核减病例数大于当日新增病例数目的时候,会得到负数的结果。这样的数据也不利于体现当前疫情的真实发展态势。我们期待能够数据公布的标准口径能一致化,这样就可以更加逻辑清晰,实事求是地反映当前疫情。

以上是根据我们实践的一些思考,欢迎大家批评指正,一起探讨。

评论关闭。