方舟子的链子真的掉了
特有理
2015-3-20
以科学的方法论证问题是一件既开心,又危险的事。开心的是,科学的结论锋利无比,所向披靡;危险的是,这是一把双刃剑,玩不好自己就彻底残废。对于方舟子打柴静所谓的“假”,我的前两篇议论文被有些人死缠烂打,大有不撞南墙不回头的架势。其中的关键,就是一个数据图表。因为其它责难的杜撰、臆测成份太大,而科学形式的图表似乎可以一剑封喉。其实我本不愿意在科学层面较真,毕竟方舟子以前打假也有许多积极的方面。但是,为了把问题解析到位,不但是对自己负责、对网友尊重、对社会也算是一种付出。其实,万维的老网友岳东晓曾经撰文指出了方舟子的错误,但是方舟子极其轻蔑地予以狡辩。他在博客中写到:“科学网首页头条登了一个叫岳东晓的妄人(一个物理博士)谩骂我的文章《方舟子妄批柴静捏造数据的错误》(http://blog.sciencenet.cn/blog-684007-873706.html )。此人多年来一贯发表无知妄言攻击我,我一般不予理会。现在既然被科学网放到了头条,我就赏他个脸”。这气焰也忒嚣张了点不是?既然是谈科学层面的问题,摆事实、讲道理就好,架子端不好可是会散掉的。那么现在我用自己的方式,掰开了、揉碎了给方舟子指出其具体的错误,同时也作为给盲目相信方舟子论点的网友的一个回答。
第一张图是柴静所展示的,北京地区在2005到2009年的五年时间里,大气污染与死亡人数变化的相关统计曲线。第二张图是方舟子找到的打假依据。据称:“图表上显示数据来源为中科院大气物理研究所。实际上它的数据取自中科院大气物理研究所在2013年12月在《大气环境》杂志上发表的一篇论文:Time-series analysis of mortality effects from airborne particulate matter size fractions in Beijing,Atmospheric Environment 81 (2013) 253-262,改自该论文的图6”。
图一:《穹顶之下》视频截图
图二:方舟子所引用的论文原图
方舟子公开声称:“这张图表示的是2005到2009年这5年北京pm2.5浓度、非事故总死亡率、呼吸系统疾病死亡率、循环系统疾病死亡率变化的情况。最上面的那条曲线是循环系统疾病死亡率的情况:在论文原图,最高的是2007年,2008年有所下降,2009年又升上去了。但是在柴静的图中,这条曲线却变成了平滑上升,也就是说,这五年北京循环系统疾病死亡率是逐年上升的。这显然与事实不符,是对原图的篡改。”
请注意:这里,方舟子明确提到图表展示的,是“【死亡率】变化的情况”。事实明确显示,方舟子错误地解读了图表中变量的性质。该图的纵坐标左侧,英文标注为:“percent increase (%)",中文译为:增长百分率。针对图表所涉及的实际研究对象,准确的解读应该是:【死亡增长率(%)】。很明显,死亡率和死亡增长率是两个完全不同的概念。对于不熟悉数据图表解读的非专业人士,我们可以用语言描述来表达。在图二中,根据数据点标的位置,该图显示:2005年循环系统疾病的年死亡增长率接近0.4%,2006年的增长率接近0.7%,2007年增长率接近2%,2008年大约1.5%,2009年的增长率大约1.8%。再根据图表下边的说明,可知增长的比较是按天统计,按年计算的:“The inter-annual variability of the estimated percent increase in daily mortality...”。这也就是说:从2005年到2009年,所涉及疾病所导致的死亡人数每年都是增加的,因为增长率都大于零。这就是《穹顶之下》所明确表达的信息,请参看图一的字幕显示。
科学容不得概念的偏差和混淆。柴静说“死亡率增加”,方舟子就把图表的变量性质解读为“死亡率”,并白纸黑字地写进了博客。“死亡率”和“死亡增长率”虽然只差两个字,但概念性质完全不同。这分明是方舟子个人科学基本功不扎实所导致的理解错误。在一个错误理解导致的错误结论的基础上,来证明别人是“假”的,这不是打假的笑话嘛!
此外,方舟子指责《穹顶之下》的图表(图一),删除了原图(图二)中pm2.5的浓度显示图标,是意图掩盖“造假”所产生的自相矛盾。“原图有一组重要的数据被柴静的图删掉了,那就是北京2005到2009年这五年每年的pm2.5平均浓度,分别是:76、84、78、69、65。可见在这五年,pm2.5值最高的是2006年,之后由于要开北京奥运会进行治理,北京pm2.5值其实是逐年下降的。柴静的图却显示那几年北京循环系统疾病死亡率逐年上升,岂不成了随着pm2.5下降,人群的死亡率是随之上升的?(按:pm2.5会立即导致循环系统疾病的死亡,不存在滞后)难怪要删掉pm2.5值,同时捏造出一条逐渐上升的死亡曲线。请问这不是捏造数据是什么?”这是方舟子的原话。
这段话的逻辑关联实际上是为了进一步证实方舟子本人的解读,其核心就是要揪住最上面那条消失的曲线。因为他把曲线的下行波动理解成了“死亡率的下降”,根源是他把图表理解成了“死亡率的变化”。
从统计分析科学的角度,对于一组数据可以应用不同的处理模型得到不同方面的信息。就像一组身高的统计数据,你可以与年龄进行相关分析,也可以与饮食习惯相关联,也可以与气候、土壤、运动、基因、等等一系列因素相联系。与不同的因素做关联,且用不同的方法去关联,曲线的形状必然会改变。方舟子只注意到了他希望看到的变化,却没有看到,在图一中,(1)原来的采样点依然保留,(2)在图表右侧,每条曲线都给出了计算模型的依据公式。那么,从数据分析的角度,离散数据的平滑处理是最常见的方法,其目的一是压缩干扰误差,二是明确变化趋势,三是便于线性处理,四是便于数据压缩。当今的图像、音频、视频的压缩都需要对数据进行平滑处理。方舟子自己少见多怪,把无知当成了检验问题的标准,这必然成为一个打假的灾难。他自己掉进了错误解读的陷阱,认为平滑的曲线就是掩盖波动带来的下降。殊不知,现实众多的应用领域,例如系统工程、金融财经,走势曲线都是由波动采样值平滑处理而得来。打假,一要看自己的专长,二要看自己的学识能力是否能够得上边。
对于年pm2.5统计数值下降,死亡人数反而增加的问题上,简单思维很容易认为这是一个明显的矛盾,然而这正是科学思维首先要避免的,只靠在简单逻辑关系的基础上做出对复杂情况的判断。按年显示统计数据只是人的一种做法,但雾霾会随之按年才发挥作用吗?有害物质怎么可能各个都像大杀伤性武器那样,三步癫、五步倒、七步就封喉?然而方舟子为了坐实其对这个表面矛盾的认可,居然特意注明“pm2.5会立即导致循环系统疾病的死亡,不存在滞后”。这“立即”是指什么样的量级,是秒、是天、是月、还是年?这么严重的指控依据如果不给出量化指标,这哪里还有一点受过现代教育的痕迹,分明就像巧舌如簧的江湖术士。
关于删除pm2.5浓度数据的问题,正是因为图表中的多种变量容易引起理解的困惑,因为有些关系要解释清楚,就必须深入到专业的分析当中。否则极易导致民众对信息的误读,就像方舟子不理解为什么pm2.5的浓度的年平均值降低了,死亡人数反而上升了一样。对于pm2.5与死亡增长率的逆向关系,有多少人会同意方舟子的“pm2.5会立即导致循环系统疾病的死亡,不存在滞后”这种说法?何况,还有另外两组数据呢(这里,图一有一个翻译错误,NAM应该是【非意外死亡】,而不是“意外死亡”)。更关键的是:从图表的曲线表示的关系,不论是图一还是图二,都指向“pm2.5【不会立即导致】循环系统疾病的死亡”这样一个可能的结论。除非方舟子反过来否定他自己作为打假依据的图二中的信息。但是,根据图表,谁又能否认其表达了大气污染的【延续】与死亡率上升之间的正相关性?方舟子的指责反倒是自己否定自己:承认原始图表是对的,那他的论据就是错的;否定图表的正确性,那他根据图表打假的依据就是错的。至于原始图表所涉及的研究方法是否正确,结论是否合理,则已经远远超出了时事评论的范畴。谁能要求柴静去给环保和医学专家们当课题研究的评审导师?
这里,不得不对中国的环保科研水平进行一下质疑。中国各种污染严重,其中必有环保科研落后的影响。同时,由于中国环保业的弱势地位,环保科研的发展也必然受到限制。说实在的,如果柴静真正是统计分析的专家,绝对不会选这种论文水平的图表。从统计专业的角度,图二那个pm2.5的统计数条绝对是个败笔。因为图表注释明确说明采样精度是按天为单位,那么与之相对应的污染采样必须以天为单位显示才有统计分析的价值。按年的平均值不但具有误读的极大可能,更反映出该研究论文专业水平的低下。说实在的,真要挑毛病,那个图表本身的专业问题很多,有的甚至可导致论文的基础坍塌。这些,即使那些拿着放大镜挑刺的各路“能人”也还没见找出来呢,但为何要丧心病狂地要求一个时事评论的记者达到甚至超出统计专家的水平?那些对雾霾具有极大容忍度的人,为何此时却表现出如此强烈的科学洁癖?柴静的报道中删除pm2.5的标注,至少是对原图表中表达问题的一种挽救。如果从积极治理雾霾的角度,面对反映环境污染的时评报道,对其中的问题和瑕疵就应该善意指出并提供补正的建议;一味深挖狠批、上纲上线,则只能暴露其自身格局的低下。
对于方舟子的打假,凡是基于正义的,我都坚定地支持。方、韩之争时我的多篇文章可以作证。但是如果违反正义原则,玩弄科学、混淆视听,我则坚决反对。雾霾都那么严重了,面对中国首个系统化的评论报道,为何要如此吹毛求疵,荼毒他人信誉,必欲置之死地而后快呢?这次,方舟子的链子真的掉了。
附:
方舟子博客文章链接:http://fangzhouzi.tumblr.com/post/113228537150
岳东晓博客文章链接:http://blog.sciencenet.cn/blog-684007-873706.html
|