0) 先来几句“铺垫”。这里我们假设只讨论成人的智力,并且假设所讨论的每个人智力是不变的,假设我们讨论的是目前最流行的韦克斯勒成人智力量表。智力,比较明显的是个体概念,因为这是你个人的某种属性;但是智商 IQ 则不是,智商是个集约的概念,它是将某个人的智力拿去和其他人相比较而得到的一个值。这和“道德”这样的概念是类似的,离开了群体去谈论道德是卑鄙还是高尚是没有意义的。比较明显的是,函数 f IQ = f (智力) 理论上是个单调函数,所以从这个意义而言,在群体/样本空间给定后,智商 IQ 就是智力的一种度量,它们之间存在 1-1 对应关系。
1) 关于 IQ 测试的两句题外话。 话题 1a):因为“智力”这个概念在 IQ 测试前就存在,所以传统意义下的“智力”,和 IQ 测试下的“智商”---- 从而智力,因为智商和智力存在 1-1 对应关系 ---- 就会有偏差,这是一般的 IQ 测试成绩用来度量智力而招致批评的主因。不过据统计,IQ 值和成绩测试之间的相关系数很高,大约有 0.70+,而 GRE 分数和成绩测试之间的相关系数不足 0.2。
话题 1b):东亚人 (大陆、台湾、香港、日本、南韩等) 的 IQ 值全球最高,部分原因是因为东亚人的学习方式造成的,应试教育能使得这个分数偏高。当然这个说法会使得部分民族自豪感很强的同学不高兴。
2) 你的智商是多少:频率学派和贝叶斯学派的分歧
你的智力是你的一种固有属性,所以你可以假设它是个固定值。但是你的智商呢?因为智商是个集约概念,它的平均值被定义成 100,所以你的智商 IQ 值,很明显,是样本空间的一个变量。如果测试的样本空间是全大陆或者全世界,你的 IQ 值若是 100,那就是十足的中庸之资,只能拿来在一群笨蛋前面显摆;但是如果样本空间是全世界的傻博士甚至是全体炸药奖得主,那得个 100 的分数就是件值得显摆的事情,至少比巴灵顿大学高才生吴征博士强。
回到咱们的话题。咱们现在的任务是从一系列的 IQ 测试成绩去估算出真实 IQ,对不对?所以一个很自然的想法就是,我虽然不知你的 IQ 的值到底是多少,但是我知道它一定是存在的,是个固定值,不会改变,亦即 IQ = constant;如果测量值越多,我们就能越精确地知道真实的 IQ 值,对不对?持这种观点的学派,称为古典的频率学派 (Frequentists),和它对立的就是贝叶斯学派(Bayesians)。贝叶斯派则认为你的真实 IQ 并不是一个固定值,而是一个随机值,也就是说,你的真实 IQ 也可以是个分布: IQ = g (IQ) 这里 g 就是参数 IQ 所服从的分布。所以从模型而言,贝叶斯学派的模型比频率派的模型更复杂,从计算角度而言,大体上贝叶斯学派关于你的 IQ (注意此时你的 IQ 是个分布) 结果,亦即所谓的后验分布,就是频率派的似然函数乘以所谓的先验分布函数。所以从方法论/哲学的角度而言,频率学派可以说是 static 的,贝叶斯学派可以说是 dynamic 的,后者的模型是不确定的,完全取决于观测数据 (亦即你的一系列 IQ 测量分数),以及一个带有主观色彩的先验分布,然后用似然函数去修正先验分布,然后得到后验分布 (亦即你的 IQ 到底是多少的一个概率分布)。自然规律 (例如你的真实智商) 到底是什么,频率派认为是客观存在的,不以你的观测结果和主观判断而改变;贝叶斯学派则认为自然规律依赖你的观测结果 (例如你的 IQ 测量值),不同的观测结果会导致不同的客观规律,而且和主观的先验分布有关;也就是说,观测数据 (外加主观的先验分布) 决定了客观规律是什么。