应增加中学生的统计学基础教育
文/渔舟舟 前面谈到, 少培养书呆子, 多造就一些接地气, 解人性,大道至简见微知著的人才,可考虑将导向微积分的初等数学教育适当调整,增加统计学的启蒙教育。统计学是什么?又是如何诞生的呢?这一节就讲这一向题。 许多学科的诞生,往往是许多人甚至几代人的共同努力,很难归功于一个人。统计学例外,它起源于一位英国哲学家兼商人格朗特(John
Graunt,1620-1674年)。大概是经商的原因,格朗特对信息有着敏锐的嗅觉。 他一生收集了229250人的死亡记录,列出了死亡的详细原因,有鼠疫,天花,狂犬病,麻疹,谋杀,死刑,饿死街头,自杀,死产,溺水,烧伤及大量的其他原因。
大量的数据与信息,揭示了许多亊实,也更正了许多传统的观点。比如,人们认为瘟疫流行是一个朝代变更的前奏,事实上这是一种谬论。人们普遍认为生男孩与生女有相等的概率,数据证明生男孩的概率更大。当时的人们认为谋杀是死亡的重要原因,事实上谋杀只是一种令人恐慌的社会现象,而不是死亡的重要原因。 除了大数据之外,统计学的另一个重要方面是数据的准确性。法国数学家勒让徳(Le
Gendre, 1752-1833)第一个解决了从数据中得出正确结论的问题。如果只有一小组观测数据,就很难估计数据中呈现的误差。增加测试数据, 虽然能弥补数据少的不足,但无论数据多少, 也只是相对的, 不可能得到全部数据。勒让德发现了一种方法,就是有效地利用现有的全部测量结果,通过计算,在使数据组的偏差达到最小的意义下,得出一组理想数据。这组数虽然不是真正的测试值,却是最优的。这就是著名的最小二乘法。 有一个关 于最小二乘法的八卦。高斯在他的一篇关于天体运行的论文中应用了最小二乘法,并声称自己很早就首先发明了这一方法。这让勒让德十分气愤,却无能为力,由于高斯无可辩驳的名望与成就,不少史学家仍然将最小二乘法归功于高斯。 统计学的发展史上,必须介绍一下英国社会活动家与艺术家皮尔逊(Karl
Pearson,1857-1936年), 皮尔逊当过几何学老师,可能是教授几何学的缘故,他对统计数据的几何表示以及曲线拟合有着独特的浓厚的兴趣。我们知道,两个量可表示为平面坐标系下的一个点,许多点可连成一条曲线。这些点的数据可能来自生活中不同的实际问题,而拟合曲线,理出两个变量之间的关糸,并不需要对问题本身有多么深刻的见解。皮尔逊对统计学的贡献, 就是找到了一种检验方法,可以测定某曲线是否是两个变量之间关系的合理表达。其中的数学思想是这样的:假定这条曲线是一个仔细定义的,大样本点集的完整表示,进而假定从这个较大的集合中,随机地抽取典型的样本,最后比较随机样本与曲线的符合程度,及实验测得的数据与曲线的符合程度,从而得到所计算的曲线拟合程度的概率测度。这就是所谓的卡方检验。该方法目前依然被广泛应用,以检验某种假设的合理性。 将统计学引入现代化管理,改变我们生活的当数休哈特(Walter Shewhart,1891-1967)。休哈特是一位美国工程师,曾经在伊利诺伊州大学学习,后来在贝尔实验室工作过一段时间。关于质量控制,休哈特认为, 关键在于有一个稳定的生产过程,有两个方面的因素影响生产过程, 即随机的影响因素和非随机的影响因素。随机的因素是我们无法控制的, 如风雨雷电;非随机因素是可以控制的,如员工的技能态度原材料质量等。管理所要做的,就是消除非随机因素的影响,迴避或控制随机因素的影响。根据这一思路,他发明了著名的休哈特图表。简单一点说,该图表就是在平面坐标下,一条水平的直线,横坐标是时间,纵坐标是产量,水平线是日平均产量。记载每天的产量,根据偏离平均线的程度,便可直观地得到产品生产的情况,判断影响生产的诸多因素。 休哈特是一个很有争议的人物,有些人认为他的思想与图表十分简单,不值得一提;有些人则认为他是质量控制的鼻祖,将统计学与经济和工程结合起来,创立了"统计质量控制"新学科。 真正理解休哈特思想的,当数戴明(William
Edward Deming,1900-1993 年)。戴明毕业于怀俄明州立大学,后来获耶鲁大学数学物理博士。在芝加哥一家公司暑期工作时,认识了休哈特,对休哈特推崇有加,并受到休哈特思想的深刻影响。戴明后来在美国农业部工作,有机会接触了大量的统计数据,于一九四O年出版了《部分抽样理论》。表面上看,讲的只是部分抽样,但他将如何迅速经济地获得样本这类问题与数学思想融为一体,其抽样理论极为全面而有实效。这体现在三个层面,即实施调查的可靠性;让调查方式以最小的成本并得到广泛认可的准确性;最终评价结果,指导实际。 我们也可以用一个更通俗的例子来理解他的抽样理论,比如人大代表。什么样的人能代表人民呢?这里首先要弄清人民算什么?人们的意愿是什么?人大代表是什么东西?这里的关键问题不是代表的荣誉性与光鲜性, 更不是代表门的临场发挥与表演性,而是抽取代表的程序的正义性, 和代表的真实性。 戴明的抽样理论发表后,虽然有一定学术声望,但在美国等西方国家,并没有受到真正的重视, 倒是受到了日本学朮界和实业界的高度推崇和热情追随。戴明应邀在日本作过许多演讲与指导。日本几乎各大行业,都遵循了戴明的质量控制和优化管理的思想。战争受到重创的日本, 在短短一代人的时间内,不少行业都超英超欧超美。日本的高速发展使欧美的产业界,认识到休哈特戴明理论改变世界改变生活的强大力量。而这时候的戴明已八十多岁,休哈特早已仙逝多年。 小结一下。我们可以粗略地这样看:格朗特创立了统计学;勒让德解决了如何从大量的统计数据中得出准确结论;皮尔逊给出了分析图表数据所需的统计学原理;休哈特以一种直观的方式解决了质量控制问题;戴明则提供了如何得到有代表性样品的系统理论。从这里也不难看出,统计学不是一门单一的学科,与传统的数学不一样,它不是纯粹的演译科学, 而是一系列的思想和技术,既是艺术也是科学,既需要仔细的逻辑推导,又需要个人的判断决策。同时, 在信息高度发达的今天,我们身不由已地生活在统计学构成的社会环境里,从新闻报道天气预报股市风云体育新闻公共安全等等,统计学几乎左右了我们的生活。 科学的统计指导我们的思考, 统计的艺术打造我们的社会主义核心价值观。不容勿视的事实是,大数据大信息每天都在巨量生产, 新理论与新技术将应运而生, 从历史的角度看, 统计学的时代, 才刚刚起步。(待续. 本系列的主要参考资料包括: 1. <> (USA, Richard
Courant); 2. <>
(USA, ); 3. <> (USA,
John Tabak), 以及网络。 适合于八至十一年级的学生家长阅读。批评与建议,请移步渔舟舟的博客)
|