科学研究:缺的是钱吗?
这是一个大数据,大科学的时代,也就是一个需要大钱做研究的时代。是否用少量的数据,甚至不用数据,是否花少量的钱,甚至不花钱,就做不出好研究?我们来看下面一个例子。
假设你投资一个基金,第一年的回报是100%,第二年的回报是-50%,两年的平均回报率是多少?我们很快可以算出,平均回报率是25%。这是一个很高的回报率,但你可能并不开心,两年期间,一分钱没赚,怎么会有25%的回报率呢?我们知道,平均值有两种算法,算术平均和几何平均。刚才我们用的是算术平均,如果用几何平均,这个投资的回报率是零。几何平均比算术平均更准确的反映实际上的投资回报。
从理论上,凯利(KELLY)证明了几何平均回报率等于信息的熵值, [1] 这样, 熵,信息,人的行为和行为的回报值这些从物理学到社会学最根本的变量都连在一起了。普朗克说过:“科学是内在的整体,它被分解为单独的整体不是取决于事物的本身,而是取决于人类认识能力的局限性。实际上存在着从物理到化学,从生物学和人类学到社会学的连续的链条,这是任何一处都不能被打断的链条。” 凯利这个简简单单的理论就是一个最好的例子。
大约三百年前,贝努利最先提出用几何平均回报率代替算术平均回报率,[2] 尽管他没有使用这些名词。既然几何平均回报率能够给人们这么清晰的理解, 为什么到现在主流理论还使用算术平均呢? 这可能有好几个原因。其中一个是, 几何平均低于算术平均。上面的投资例子,算术平均是很漂亮的25%,而几何平均则是很难看的0%。所以,专业人士都喜欢算术平均。
从一个简单的投资问题,不需要什么数据,不需要什么资金,就可以看到主流理论明显的缺点, 也可以看到简单的,漂亮得多的代替理论。主流理论长期统治这个社会,不是由于我们缺乏能够探测到其问题的大数据方法,也不是由于我们缺乏大量资金来寻找更好的理论。恰恰相反,正是由于大量资金的存在, 掩盖了真相微弱的声音。
参考文献
1. Kelly, J. (1956),"A New Interpretation of Information Rate", Bell System TechnicalJournal35: 917–926
2. Bernoulli,D. 1738 (1954).Expositionof a New Theory on the Measurement of Risk.Econometrica, 22(1),23-36.
|