花蜜蜂剧场
既已化云聚天穹,何又成雨洒西东?落地入土润苍生,飞天志在搭彩虹!
来自: 中国
注册日期: 2012-09-16 访问总量: 4,144,235 次
点击查看我的个人资料
敬告: 您的浏览器已关闭活动脚本,开启后才可正常使用!
关于大饥荒怎么用统计来说谎
关于大饥荒的著作不断出版——非正常死亡数字已经从杨继绳《墓碑》中的3,600万飙升到冯客《毛泽东的大饥荒》中的4,500万。中国官方的非正常死亡人数1000万,有人评论说,数字相差这么大,中国人的命真的这么不值钱么? 香港中文大学教授,清华大学长江讲座教授王绍光指出统计数据也能做假,要研究大饥荒就要将其放在历史与比较的视角来看,更不能轻忽民国时期对三年大饥荒死亡率急升的影响。 本文摘录自《开放时代》2014年1月刊发“统计与政治”研讨会记录稿,王绍光教授关于大饥荒部分的发言: 今天上午听发言时,我感觉有一个几乎没有言明的假设,即统计与政治的主要问题是数据的质量。大家关心的是数据质量好不好,数据存不存在虚假,但实际上,统计与政治的关系存在于使用数据的每个阶段。 首先是数据本身,数据的真假、好坏。 二是关于数据的描述性分析。我待会要讲的就是描述性分析,哪怕数据全部真实,政治对数据的描述性分析可以影响很大。 三是使用数据做因果分析,那里面的政治影响就更是不得了。凡是做过因果分析的人都知道,如果最初做出的统计结果不符合自己预期,就会用别的方式再试一下,一直试到满意为止。 除了因果分析,还有预测性分析,用现有统计数据做未来的预测,里面的问题也非常多。实际上统计与政治的关系存在于跟数字相关的每个阶段,而不仅仅在于某一个阶段。 上面是题外话,今天我讲的主题是“‘正常’与‘非正常死亡’——从历史和比较视角看‘大饥荒’”。 我今天不讨论数据的质量问题,也不估算死亡人数,因为我没有这个能力,更何况做估算的大有人在。我要讨论的是如何从历史与比较的视角看中国的“大饥荒”。 我所使用的是中国与国际组织的数据,并假设它们是可靠的。当然,我并不认为这些数据都是可靠的,只是不在这里纠缠数据的质量问题罢了。有些被广泛使用的数据其实问题很大,孙经先老师会讨论这方面的问题。 有一本新书大家可能都知道,就是香港大学冯客写的《毛泽东的大饥荒》,有中文版,有英文版。两个版本的封面都带有饥民的照片,很悲惨,让人心酸。 这种封面可以让不明就里的人误以为这些照片真实反映了“大跃进”以后中国的情况,但是这两个封面实际上反映了作者在使用“证据”方面极不负责的态度。其实,这两张照片与所谓“大饥荒”毫无关系,它们不是拍摄于“大跃进”之后,而是拍摄于1946年5月,画面中是湖南醴陵的饥民。熟悉中国灾荒史的人都知道,1946年中国没有什么值得一提的灾荒,但还是出现了这么多饥民。拿解放前的饥民作为解放后所谓“大饥荒”的证据,这一方面是误导读者,另一方面也可以看做暗示一种比较,即解放前后的比较。
冯客:《毛泽东的大饥荒》中英文版封面都带有1946年的饥民照片,与“大饥荒”无关 冯客书中有一句话我觉得说得很正确。他说:“人口学家会区分‘自然’与‘非自然’死亡,为的是估算大概有多少人本不会死,却因为饥荒而丧命。”他接着说:“为了估算有多少‘额外’死亡,就必须设定一个平均死亡率。那么什么是比较合理的平均死亡率呢?” 这是一个相当好的问题,但对它的回答恐怕并不简单。凡是讲统计与政治关系的书都会讲到使用平均值的问题。有一本有趣的书,题为《怎么用统计来说谎》(How to Lie with Statistics)。大家知道马克·吐温有一句著名的话:“世界上有三种谎言:一种是谎言,一种是可耻的谎言,第三种叫统计。”这本书就是揭露有些人怎么用统计说谎。该书第二章专门讲平均值的问题,标题为“精心选择的平均值”。作者说:“因为平均值的含义非常宽泛,它时常被人用作影响公众看法的小把戏。”作者还说:“因为平均值对复杂的现象做出过于简单的描述,它往往比无用更糟糕。” 2007年出版了一本书,书名是《狐假虎威》(The Tiger That Isn’t)。这个书名的意思是,摆弄数字看起来很不得了,其实往往不过是借数字来唬人而已。这本书的第五章也专谈平均值,标题是“平均值:白色的彩虹”。这是什么意思呢?本来彩虹由七色组成:红、橙、黄、绿、靛、蓝、紫,很多彩多姿,但如果你把彩虹弄出个平均值来,各种颜色一平均就是一片白了,黯然失色。这也就是说,如果用平均数来分析彩虹,彩虹就不再是彩虹了,毫无意义了。作者说,玩弄平均值有两种手法,一是把生活中的起起伏伏全部抹掉,使它变得平淡无奇;二是把平均值当做“典型”、当做“正常”、当做“合理”。冯客说要找到一种“合理”的平均值,而这本书的作者告诫我们,要避免把平均值当做“合理”、当做“正常”。 还有一本书值得一提,它已有中译本,题为《统计数据的真相》,其第五章的标题很醒目:“受操纵的平均值”。 作者一针见血地指出:“平均值通常模糊了事实上所存在的巨大差异,原因在于它完全掩盖了平均值的离散度……在这里可能存在两种不同的情形,一种情形是,所有这些数值非常紧密地集中在平均数的周围;另一种情形是它们四处分散,而不是集中在平均数的周围。然而,人们仅仅根据平均值指标是看不到这两种情形的区别的。” 正是因为平均值具有简化复杂现实的功能,它经常被政客引用,也经常出现在学术讨论中,因此我们常常看到由平均值引起的争议。有笑话说,一位聚会的主持人向来宾介绍了比尔·盖茨后宣布了一个好消息:由于盖茨的到来,所有与会者的平均收入瞬间翻了无数倍。但这个好消息有任何实质意义吗? 回到冯客的问题,为了计算“大饥荒”产生的“超额”死亡人数,先得有一个“合理”的平均死亡率。那么,如何得出这个“合理”的平均死亡率呢?无非有两种方式。 第一种方式是进行历史比较,根据饥荒前各年的死亡率来计算平均死亡率。这样做的话,需要确定包括饥荒前几年。我看到有些人直接用1957年的死亡率,把它当做“合理”的平均值;还有人拿1957年、1962年、1963年的数据进行平均。这里的关键是,用哪些年份进行平均,这本身就是政治性的选择,因为选哪些年进行平均,关系到分子和分母。 第二种方式是进行跨国比较,根据一组参照国家的死亡率计算平均死亡率。如果这么做,关键在于包括哪些国家,哪些国家才算得上可比国家。 计算平均死亡率听起来很简单,其实未必如此。如果把芬兰从1751年到现在的死亡率变化情况放在一张图上,我们会看到芬兰在1866~1868年饥荒时期死亡率达到80‰。这个死亡率是非常之高的,中国灾荒的死亡率一般没有那么高,只达到千分之四五十左右。计算芬兰这次饥荒前的平均死亡率比较容易,因为灾荒前的各年的平均死亡率呈上下波动状,没有明显的趋势。 但是,换一个国家德国,情况就不同了。德国在1916~1918年也出现一次饥荒,死了不少人,死亡率攀升至25‰。但德国在1877年以后,死亡率长期持续大幅下降。1916~1918年间的死亡率虽然比前几年高出很多,但低于下降趋势出现前的正常死亡率。这样,如要计算德国以前的平均死亡率就不容易了,取决于选多少年平均。 再看希腊的例子。希腊1941~1944年经历饥荒,死亡率超过25‰。不过在饥荒前那些年,希腊的死亡率只是在短期内有所下降。在这种情况下,应该如何计算平均死亡率呢? 在1918年大流感发生时,美国黑人的死亡率是25‰,白人的死亡率是18‰。但什么是“正常”的平均死亡率呢?是用黑人此前各年的死亡率计算“正常”,还是用白人同期的死亡率作为参照“正常”,或是用白人此前各年的死亡率计算“正常”?如果用后两个指标,黑人的超额死亡简直太高了。事实上,美国黑人与白人在死亡率上的差别一直持续到60年代末。人们完全有理由得到这样一个结论:在20世纪60年代民权运动以前,黑人在美国一直是大规模超额死亡,也就是非正常死亡太多。 同样的情况也出现在南非。1935年以后,南非白人死亡率几乎维持在10‰左右,但黑人死亡率最初高达25‰,以后虽逐步下降,但仍然大大高于白人,差距到八九十年代才变得比较小。如果白人的死亡率是“正常”死亡率的话,黑人长期大规模“非正常”死亡。 上述各国的例子说明,计算“合理”的平均死亡率不是一件容易的事。 中国的官方统计数据显示,解放后死亡率大幅度下降,从1949年的20‰猛降至1957年的11‰,但在1960年又猛升至25‰。饥荒过后不久,死亡率就跌至10‰以下了。短期内,变化如此剧烈,应该怎么计算“正常”的平均死亡率呢?这不是个简单的问题。 上面提到计算“正常”平均值的思路。从历史比较的视角看,应与过去比,如与“大跃进”之前相比,这是大多数研究者的做法。但也可以和解放前相比,因为事实上冯客无心但潜意识地暗示了1946年的情况和大饥荒的情况差不多。从跨国比较的视角看,应与其他国家比。跟哪些国家相比呢?印度恐怕是最具可比性的国家。也可以与其他最不发达的国家比,因为中国1960年前后的发展水平属于最不发达国家,比印度还差一点。 跟“大跃进”以前比较的话,必须记住阿玛蒂亚·森在《饥饿与公共行为》中的告诫:“然而,必须记住,因为中国的死亡率早在饥荒前就已显著下降,因此基于饥荒前死亡率的‘额外死亡’估计,是与一个低于世界上大多数穷国的饥荒前死亡率相比而得到的。”这句话是放在一个注脚里面,而不是正文里面。研究大饥荒的人都喜欢引用阿玛蒂亚·森,但似乎很少有人注意这段话。这段话警示我们,计算额外死亡率所需的“合理”的平均死亡率不易确定。 中国的粗死亡率1949年是20‰,1957年降至11‰,只用了8年时间。那么,一般而言,粗死亡率从20‰降为11‰需多少年呢?请看这张表(见表1)。
在发达国家,粗死亡率从20‰降为11‰需要很长时间,最少40年,最长144年,这发生在19世纪与20世纪初,那时全球的医疗卫生水平都太低。越往后,需要的时间越短。毛里求斯粗死亡率从20‰降为11‰用的时间最短,只用了12年。但并不是所有后发达国家都是如此,如印度花了41年,菲律宾也花了41年。是中国“正常”,还是它们“正常”?所以,要讲什么是“正常”的平均数,不太容易。 实际上,最早研究分析大饥荒问题的美国学者朱迪思·班尼斯特(Judith Banister)也注意到这一点, 她说:“在降低死亡率方面,中国是个超级成功者。”留美人口学家王丰最近也在一篇文章中说:“在二十世纪后半叶全球人口转型的过程中,中国是个超常成功者。”如果1949年以后,中国在死亡率下降方面一直都是“超常”的,我们应该拿什么作为“正常”平均死亡率呢? 前面说,中国1960年的死亡率是25‰,那是官方的数据。也许有人会说,官方数据靠不住。大量非官方的数据当然更不靠谱。讲非官方数据 ,要看学术界比较认可的数据,如朱迪斯·班尼斯特、安斯利·科尔(Ansley Coale)、杰拉德·卡洛(Gerard Calot)、巴兹尔·艾希顿(Basil Ashton)、蒋正华的测算。这些学者都认定1960年死亡率最高,但对死亡率到底有多高的估算不同,基本在30‰至45‰之间。 假设大饥荒最糟糕时的死亡率在25‰至45‰之间,与解放前相比可以得出什么结论呢?关于解放前的死亡率有大量研究,这张表列举了学界比较认可的估算(见表2)。
从表格上看,学界对民国期间正常的死亡率估算处于25‰到45‰之间。当时的一些研究也列举了印度以及其他国家同期的死亡率数据。我们看到,民国时期的死亡率不仅高于印度,而且高于其他一切有数据的国家,是全世界死亡率最高的国家。需要指出的是,这里引用的估算排除了战争(包括抗日战争与解放战争)的影响,是对民国“正常”状况(尤其是所谓“黄金十年”)的估算。也就是说,“大跃进”以后最糟糕的情况相当于解放前的“正常”情况。如果没有解放后的快速进步,1960年的死亡率也许会被看做很“正常”。 跨国比较,先跟印度进行比较。因为到1960年时,印度的人均GDP仍高于中国。我有两组数据,一组是联合国的数据,一组是世界银行的数据。两组数据都显示,除了1960年,在此前后中国的死亡率都大大低于印度(约低10‰)。前面说过,研究中国大饥荒的人都喜欢引用阿玛蒂亚·森的话,但会有意无意忽略他的如下论述:“我们必须看到,尽管中国饥荒死亡人数很多,但印度正常时期经常性剥夺所造成的额外死亡人数却使前者相形见绌。对比中国7‰的死亡率,印度为12‰。将这一差别运用于印度1986年7.81亿的人数,我们可以估计得到印度每年390万的过多死亡人数。这表明,由于更高的经常死亡率,印度八年左右的死亡人数要比中国1958~1961年大饥荒中的死亡人数多。看起来,印度每八年都在努力往自己的碗橱中填塞多于中国在不光彩的年份所放置的骸骨。” 这里,森与合作者承认使用了学界最高的死亡估计(2,950万人),如使用较低的死亡估计,那么印度额外死亡人数超过中国1958~1961年饥荒造成的额外死亡人数所需时间不是八年,而是更短。此外,森与合作者假设中印在死亡率上的差别是5‰,但在六七十年代,两者之间的差距实际上是7‰~10‰。因此,相比中国,除1958~1962年以外,印度每三年、每五年的额外死亡人数要比森与合作者估计的中国大饥荒死亡人数多得多。 我们还可以拿中国1960年的情况和其他最不发达国家相比。按照1990年国际不变价格的美元计算,1960年中国的人均GDP在全球各国中排倒数20,印度排倒数31,换句话说,印度在1960年的人均GDP比中国要高。所以,拿当时的中国跟最不发达国家相比是有道理的,中国当年就属于最不发达国家。
上一张图(见图1)上的横轴是当年的人均GDP,竖轴是粗死亡率,每一点代表一个国家,其中中国由三角形代表。图中使用的是中国官方数据25‰,在其他收入水平与中国相似的最不发达国家,死亡率在18‰~35‰左右摆动。如果用1962年的数据画一张同样的图,中国的三角形就降到了10‰左右,可以与当时的发达国家相比了。这就是说,按官方数据25‰算,中国最糟糕那一年的状况相当于最不发达国家的平均粗死亡率。 我们可以把上面的各种观察做个小结。 与“大跃进”前相比,死亡率急升,但此前曾快速下降;与解放前相比,相当于解放前的“正常”情形;与印度相比,最糟时比印度的“正常”情形略高;与其他最不发达国家相比,相当于这类国家的“正常”情形。 最后,顺便讨论一个问题:与“大跃进”前后相比,困难时期什么样的人最容易折寿? 不少研究发现,婴儿与儿童期的营养不良可能导致后期死亡率较高。例如,对芬兰1866~1869年大饥荒的研究发现,这个时期出生的人,在17岁以前,比其他人更容易死亡。另一项研究聚焦于意大利那些在婴儿与儿童期经历过磨难的人群,发现直到45岁以前,这些人的死亡率都比旁人高。也有人研究中国“大跃进”后困难时期出生的人,发现在11~12岁以前,这些人的死亡率比较高。 我的推测是,三四十年代出生的人是营养不良的,这也许是导致1958~1961年死亡率较高的原因之一。凭什么说三四十年代出生的人营养不好呢?有实际证据,这就是不同时期出生人群的平均身高。 大量历史与比较研究发现,在一国之内(假设基因相同),各年龄组(不是个别人)的平均身高与其胎儿期、婴儿期的健康和营养情况有关。一位澳大利亚学者研究了1935年到1975年出生的中国男人与女人的身高。他的数据统计表明,1935~1949年出生的男人平均身高在1.67~1.68米之间上下波动;1935年以前出生的人没有数据,但想必其在胎儿期与婴儿期的营养状况也不会好到哪里去。1949年后,男人的平均身高开始持续上升,到1957年已接近1.7米;女人平均身高比男人低,但变化趋势也差不多。 换句话说,解放前出生的那些人在胎儿期与婴儿期的营养状况是比较糟糕的。“大跃进”后困难时期出生的人平均身高也有所下降(约0.3厘米),这说明营养状况影响了他们的身高。但即使下降,这群人的平均身高仍比40年代末出生的人高1.5厘米。 解放前出生的人营养不好,他们在50年代末和60年代初的年龄应是15岁以上。在这里,我引用李若建老师《困难时期人口死亡率的初步分解分析》一文提供的数据,我的解读对不对,请李老师指正。文中列举了贵州1958年和1960年死亡人口的年龄分布。 一般而言,婴儿与儿童比较容易夭折。但对比1958年我们发现,1960年10岁以下各年龄组(即解放后出生的人)的死亡人数占全部死亡人数的比重没有上升,而是下降了,反倒是10岁以上各年龄组(即解放前出生的人)死亡人口占总死亡人口比重是上升的。 这似乎意味着,由于胎儿期与婴儿期营养相对更差一些,解放前出生的人到1958~1960年困难时期更容易死亡。与其他各省相比,贵州在1958~1962年间粗死亡率全国第二高,仅次于四川。贵州的数据基本上支撑我前面的假设。其他省是否有数据引证这个假设,这需要进一步的研究。 我感觉,现在对所谓大饥荒研究的角度还不够多,需要研究的课题非常之多。我们看到像杨念群做疾病史,做到清代这段时间,其实建国以后的疾病史也非常值得研究。还有大量的东西可以做,而且很可能跟你解释饥荒的东西是有直接关系的。台湾学者刘翠溶研究过台湾历史上的疾病与死亡。那么,“大跃进”前后疾病与死亡发生了哪些变化?在这方面需要有大量的研究。 (栾泠 编辑 多维新闻)