此文原发翰山网(2020-2-8)
武汉肺炎疫情暴发,封城已经过了第一个十四天周期,人们在期望和开始谈论“峰值”和“拐点”。 1月27日,香港大学医学院院长梁卓伟表示[引],根据研究模型分析,目前新型冠状病毒基本繁殖率为2.13,疫情每6.2天会倍增,预估武汉市已有4.4万人感染,整体疫情会在4、5月“见顶”,至6、7月慢慢减退。 1月28日下午[引],国家卫健委高级别专家组组长、中国工程院院士钟南山在接受新华视点采访时表示:“疫情什么时候达到高峰,很难绝对地估计。不过我想应该在一周或者十天左右达到高峰,不会大规模地增加了。” 2月2日[引],钟南山:疫情高峰在未来10天至两周左右出现。 2月4日[引],中国工程院副院长、中国医学科学院院长王辰也曾表示,对于社区传播疫情,目前严重且情况并不甚清楚,绝对不能轻视。现在还没有判断疫情高峰、拐点的依据。 2月7日下午[引],钟南山院士参加广东省卫生健康委员召开的会议,并对疫情相关热点问题接受了记者采访。从数据看,全国确诊病例数量上升,但是新增确诊病例是下降的(2月4日-6日),这能证明什么吗?是否可以说明拐点到来了? 钟南山:不能证明拐点到来,我估计这个拐点到来还得有几天。新增病例是最关键的指标,出院病例的话,大家对出院的标准不一样,但是新增病例是一个重要指标。现在看起来,没有继续的新增病例明显增高,这是个好事。但是这是不是意味着拐点就来了呢?言之过早。 什么是峰值,拐点?似尚莫衷一是。实际上拐点,峰值是个数学上的定义。为方便读者,本文把结论写在前面,以及由此推出的重要结论:全国(除湖北),湖北(除武汉)已经见到拐点,然后简单分析解释其数学由来,以及相应的一些问题。 结论: 1,拐点是在累积确诊数曲线上:
由每天增加数曲线的峰值确定:
从每日增量图上可以看到,全国(灰色)在2月3日达到峰值,前后都比其小,我们可以确定这是一个累积确诊数的拐点;同理,湖北在2月5日是拐点。武汉,虽然2月4日达到峰值,前后都低,但是2月7日又上来,我们还不能确定其拐点。
分析: 1,数学定义,何谓拐点,何谓峰值?
显然,我们希望找到累积确诊数曲线坡度增大(增加越来越快)和坡度小(增加变慢)之间的拐点,如下图所示:
如何找到拐点?在数学上,就是这条曲线的一阶导数的峰值(最大值或最小值)点。
2,我们的定义: 在武汉肺炎问题中,我们要在累积确诊数曲线中找到拐点(增速下降的点):
我们的方法是找到累积确诊数曲线的一阶导数,即每日增加确诊数,的峰值处:
从每日增量图上可以看到,全国(灰色)在2月3日达到峰值,前后都比其小,我们可以确定这是一个拐点;同理,湖北在2月5日是拐点。武汉,虽然2月4日达到峰值,前后都低,但是2月7日又上来,我们还不能确定其拐点。于是,我们有:
相应的累积诊断数的拐点:
3,解释:
第一,为什么我们用确诊每日增量,而不简单用增长率?
首先,按定义,累积确诊增长数是时间的函数,它的一阶导数仍旧是时间的函数,而增长率不是;另外,从结果来说,一般来说,增长率是下降的,因为累积量越大,其相对增量(百分比)越小,但并不代表其增长趋势下降。下面两图是实际资料,可以看到差别:增长率是下降的,但是每天都增量还在增加,绿线箭头标出的是武汉,湖北/全国是同样的趋势。
增长率下降
每日增量仍在上升
第二,我们为什么用湖北(不包括武汉),以及全国(不含湖北)的资料,而不是简单用武汉/湖北/全国资料? 这是因为如我上文《武汉肺炎升速下降,未见峰值 --- 下周预报订正》中的分析,武汉的资料里面有虚假信息:
这张图,确诊增长率有两个峰值,一开始的增长高峰,还有一个在1月27日。后者貌似是二次爆发,其实不是,是武汉之前累积没有报的病例一次补报,大概不反映真实疫情,倒可能显示人为的干扰或疏忽。
这个人为的干扰和疏忽,表现在一方面,开始的瞒报的累积;也包括透明之后由于累积太多没有足够物资造成的耽搁。这些人为的扭曲,假定在武汉之外不存在。但是如果简单用湖北/全国资料,这些扭曲将传到湖北/全国,如下图:
所以,我们要用 湖北-武汉,全国-湖北 的资料来分析。钟南山等,没有发现拐点,估计是他们没有注意到资料中这个武汉的扭曲。
第三,如果明天湖北或全国的数值又回升怎么办?或者,如果有两个或以上拐点怎么办? 我随便选一个,湖北随州,有多个峰值,对应多个拐点。很明显,我们应该确认2月3日所对应的峰值为拐点。我们可以称其为趋势拐点。
分析各个省或城市的资料,可以找出其相应的拐点。希望拐点尽快来到,也希望人们抓住它!
|