首先對華政委表示一下敬意。這回坦誠他自己沒搞清楚被繞進去了。說話有擔當。對就是對,錯就是錯。有的右派朋友說他說被繞進去了還屬於認錯不徹底。我則不這麼認為。為啥吶。因為概率里很多東西就是很繞人。比如我家沙嫂。人聰明無比但是沖她話講她上大學時就怕概率。因為總覺得概率那個東西你怎麼說好像都有理。什麼都是似是而非。什麼都有點道理可又哪兒不對勁。所以政委說被繞進去了我理解。應該是屬實的。
那麼概率到底容易不容易理解吶?我以為只要你把幾個彎子轉過來了。概率就是件挺容易的事情了。
之所以有概率論的出現。就是因為人們在日常生活中遇到的些不確定事件。古典概率就是從擲骰子投硬幣這些賭博活動發展起來的。現代概率則是通過把概率某些原則的公理化。將概率轉換成了通過對測度函數的研究從而使之嚴格化並成為了數學中一個嚴謹的分支。這個說起來那就扯遠了。就不再贅述。同時我在這裡就某些概念的理解方面就不企圖在有些東西的陳述上搞得太嚴謹而注重詞藻了。這個就是為了科普用。有些專業人士就不用太挑剔了。
現在說第一個彎子。什麼是概率或者說幾率。要說明這點就先明白什麼是樣本空間和隨機事件。舉個例子吧。扔一個硬幣。它的統共可能結果就無非是正面反面。或者0,1,或者什麼你自己願意定義的東西吧。總之這個樣本空間有兩個樣本。那麼什麼是概率吶?我建議你這樣理解。概率就是這每一個樣本所固有的一個數字0和1間的個數字。這個數字表明了當你在從這個樣本空間任取一個結果時這個樣本發生的幾率。這個概率有什麼特別屬性吶?就是每一個獨立樣本的幾率加起來是1. 如果把幾個樣本和起來那麼這個集合的概率就是這些獨立樣本的概率之和。而如果有兩個集合相交,那麼併集的集合如何計算。交集的集合如何計算等都是有規定的。這裡就不詳述了。總之這個概率我們就把它當作一個就如同質量似的固有的東西。那麼一個隨機變量到底在產生結果時出現怎樣的結果就是被這個固有的東西所有屬性所決定的。
那麼具體到最近的討論。投硬幣很多次。比如說1000次。我們討論的樣本空間是則是從0 到 1000 的所有整數。而對於每一個數字。它發生概率通過二項分布就可以計算出來。
在這裡。我問你個問題。數字 500(也就是說正面出現500次) 產生的概率說明的是什麼? 是一個硬幣正面還是反面的概率麼?
答案。不是。這個數字表明的是你如果撒1000次硬幣,出現五百次正面的概率。直覺的表示就是如果你撒一千次當作一次實驗而重複足夠多的話,那麼一個實驗中五百次正面的可能性就是嘎子和真空以及右撇計算及模擬的那個數字了。
所以說要搞明白什麼是概率就一定要明白什麼是樣本空間。這個是第一個彎子。
第二個彎子。什麼是極限。
要提大數定律就必須要先理解什麼叫極限。有同學說極限不就是當N趨於無窮時的極限值麼。可是什麼叫做N趨於無窮。無窮是個什麼東東。你是看不見摸不到的。你憑什麼就說它趨於無窮時就趨於什麼值了?數學上是怎麼表明的。記得當初兔子大談無限如何等等。我就說你根本沒搞明白無限這個概念在數學裡是通過什麼來完備的。結果這回看他回來問的些個問題可見沒什麼長進。
其實在數學裡。無限的概念永遠是通過有限來表達的。採用的方式就是通過描述精度的不斷改進這個過程。學數學最常用的句話就是任給一個精度值。如果我能找到一個足夠大的N使得任何一個這個N以後的數字都與我們認定的那個極限值的誤差少於這個精度的話那麼這個序列就是趨向於這個精度值的。
所以有重要一點就是一個極限值並不意味着你會真的等於這個值。最明顯的例子就是1/N,你讓N趨於無窮。這個數列極限是0,但是你任挑一點它都不是零,無論N多大。然而隨便你要求什麼精度。我肯定可以找到一個N值使得從這個N以後的所以值都在這個精度以內。
這個,就是極限的真諦。
那麼我現在就是說大數定律吧。其實大數定律還又分強大數和弱大數定律。我這裡就說說伯努利的弱大數定律吧。
如果我用簡單直觀的話來描述的話就是。任給一個精度e,你如果擲硬幣次數足夠多的話。那麼出現正面的比例和固有概率值的差距小於e的概率就幾乎為一了。
記住這裡
不是一個定數。同樣是一個隨機變量。
那麼具體到我們說的撒一千次硬幣時。這個變量可能是501/1000, 或者是499/1000,等等。大數定律說的是如果你給我一個精度。比如說 0.1吧。那麼我能保證我會找到一個足夠大的N值。比如說一萬次。這樣在我扔超過一萬次硬幣時。出現的正面比例在49.9%和50.1%之間概率會趨近於一。(這裡我sloppy一點了。嚴格的陳述就沒必要了)。
所以說現在回過頭來看看。怎麼理解大數定律。比如說我扔一萬次硬幣。那么正面的百分比我可以說幾乎肯定是在49.9%和50.1%之間(設若p是0.5)。這也就是為何在實際中你扔一萬次硬幣幾乎總是看到正面的比例在這個精度中。
那你會問了。這個怎麼和關於 一萬次中出現五千次的概率小於一千次中五百次的現象說得通吶?這個就是要理解在這個0.1的精度中。你其實還有很多樣本的。就比如一萬次中從出現正面4990到5010次正面都是屬於這個範疇。也就是有21個可能性。所以注重點在於這個精度本身是界定了一個獨立事件之集合的概率趨近於一,而不是一個獨立事件的概率趨於一。在這個集合里,每單個的概率都是趨於零的。但是他們的集合卻是趨於一的。這樣一想的話你就應該理解了。
|