科學研究:缺的是錢嗎?
這是一個大數據,大科學的時代,也就是一個需要大錢做研究的時代。是否用少量的數據,甚至不用數據,是否花少量的錢,甚至不花錢,就做不出好研究?我們來看下面一個例子。
假設你投資一個基金,第一年的回報是100%,第二年的回報是-50%,兩年的平均回報率是多少?我們很快可以算出,平均回報率是25%。這是一個很高的回報率,但你可能並不開心,兩年期間,一分錢沒賺,怎麼會有25%的回報率呢?我們知道,平均值有兩種算法,算術平均和幾何平均。剛才我們用的是算術平均,如果用幾何平均,這個投資的回報率是零。幾何平均比算術平均更準確的反映實際上的投資回報。
從理論上,凱利(KELLY)證明了幾何平均回報率等於信息的熵值, [1] 這樣, 熵,信息,人的行為和行為的回報值這些從物理學到社會學最根本的變量都連在一起了。普朗克說過:“科學是內在的整體,它被分解為單獨的整體不是取決於事物的本身,而是取決於人類認識能力的局限性。實際上存在着從物理到化學,從生物學和人類學到社會學的連續的鏈條,這是任何一處都不能被打斷的鏈條。” 凱利這個簡簡單單的理論就是一個最好的例子。
大約三百年前,貝努利最先提出用幾何平均回報率代替算術平均回報率,[2] 儘管他沒有使用這些名詞。既然幾何平均回報率能夠給人們這麼清晰的理解, 為什麼到現在主流理論還使用算術平均呢? 這可能有好幾個原因。其中一個是, 幾何平均低於算術平均。上面的投資例子,算術平均是很漂亮的25%,而幾何平均則是很難看的0%。所以,專業人士都喜歡算術平均。
從一個簡單的投資問題,不需要什麼數據,不需要什麼資金,就可以看到主流理論明顯的缺點, 也可以看到簡單的,漂亮得多的代替理論。主流理論長期統治這個社會,不是由於我們缺乏能夠探測到其問題的大數據方法,也不是由於我們缺乏大量資金來尋找更好的理論。恰恰相反,正是由於大量資金的存在, 掩蓋了真相微弱的聲音。
參考文獻
1. Kelly, J. (1956),"A New Interpretation of Information Rate", Bell System TechnicalJournal35: 917–926
2. Bernoulli,D. 1738 (1954).Expositionof a New Theory on the Measurement of Risk.Econometrica, 22(1),23-36.
|