设万维读者为首页 万维读者网 -- 全球华人的精神家园 广告服务 联系我们 关于万维
 
首  页 新  闻 视  频 博  客 论  坛 分类广告 购  物
搜索>> 发表日志 控制面板 个人相册 给我留言
帮助 退出
shazhizhou  
老沙的自留地  
https://blog.creaders.net/u/5316/ > 复制 > 收藏本页
网络日志正文
用layman's terms说说大数定律。 2014-09-08 15:59:23


首先对华政委表示一下敬意。这回坦诚他自己没搞清楚被绕进去了。说话有担当。对就是对,错就是错。有的右派朋友说他说被绕进去了还属于认错不彻底。我则不这么认为。为啥呐。因为概率里很多东西就是很绕人。比如我家沙嫂。人聪明无比但是冲她话讲她上大学时就怕概率。因为总觉得概率那个东西你怎么说好像都有理。什么都是似是而非。什么都有点道理可又哪儿不对劲。所以政委说被绕进去了我理解。应该是属实的。


那么概率到底容易不容易理解呐?我以为只要你把几个弯子转过来了。概率就是件挺容易的事情了。


之所以有概率论的出现。就是因为人们在日常生活中遇到的些不确定事件。古典概率就是从掷骰子投硬币这些赌博活动发展起来的。现代概率则是通过把概率某些原则的公理化。将概率转换成了通过对测度函数的研究从而使之严格化并成为了数学中一个严谨的分支。这个说起来那就扯远了。就不再赘述。同时我在这里就某些概念的理解方面就不企图在有些东西的陈述上搞得太严谨而注重词藻了。这个就是为了科普用。有些专业人士就不用太挑剔了。


现在说第一个弯子。什么是概率或者说几率。要说明这点就先明白什么是样本空间和随机事件。举个例子吧。扔一个硬币。它的统共可能结果就无非是正面反面。或者0,1,或者什么你自己愿意定义的东西吧。总之这个样本空间有两个样本。那么什么是概率呐?我建议你这样理解。概率就是这每一个样本所固有的一个数字0和1间的个数字。这个数字表明了当你在从这个样本空间任取一个结果时这个样本发生的几率。这个概率有什么特别属性呐?就是每一个独立样本的几率加起来是1. 如果把几个样本和起来那么这个集合的概率就是这些独立样本的概率之和。而如果有两个集合相交,那么并集的集合如何计算。交集的集合如何计算等都是有规定的。这里就不详述了。总之这个概率我们就把它当作一个就如同质量似的固有的东西。那么一个随机变量到底在产生结果时出现怎样的结果就是被这个固有的东西所有属性所决定的。


那么具体到最近的讨论。投硬币很多次。比如说1000次。我们讨论的样本空间是则是从0 到 1000 的所有整数。而对于每一个数字。它发生概率通过二项分布就可以计算出来。


在这里。我问你个问题。数字 500(也就是说正面出现500次) 产生的概率说明的是什么? 是一个硬币正面还是反面的概率么?


答案。不是。这个数字表明的是你如果撒1000次硬币,出现五百次正面的概率。直觉的表示就是如果你撒一千次当作一次实验而重复足够多的话,那么一个实验中五百次正面的可能性就是嘎子和真空以及右撇计算及模拟的那个数字了。


所以说要搞明白什么是概率就一定要明白什么是样本空间。这个是第一个弯子。


第二个弯子。什么是极限。


要提大数定律就必须要先理解什么叫极限。有同学说极限不就是当N趋于无穷时的极限值么。可是什么叫做N趋于无穷。无穷是个什么东东。你是看不见摸不到的。你凭什么就说它趋于无穷时就趋于什么值了?数学上是怎么表明的。记得当初兔子大谈无限如何等等。我就说你根本没搞明白无限这个概念在数学里是通过什么来完备的。结果这回看他回来问的些个问题可见没什么长进。


其实在数学里。无限的概念永远是通过有限来表达的。采用的方式就是通过描述精度的不断改进这个过程。学数学最常用的句话就是任给一个精度值。如果我能找到一个足够大的N使得任何一个这个N以后的数字都与我们认定的那个极限值的误差少于这个精度的话那么这个序列就是趋向于这个精度值的。


所以有重要一点就是一个极限值并不意味着你会真的等于这个值。最明显的例子就是1/N,你让N趋于无穷。这个数列极限是0,但是你任挑一点它都不是零,无论N多大。然而随便你要求什么精度。我肯定可以找到一个N值使得从这个N以后的所以值都在这个精度以内。


这个,就是极限的真谛。


那么我现在就是说大数定律吧。其实大数定律还又分强大数和弱大数定律。我这里就说说伯努利的弱大数定律吧。


如果我用简单直观的话来描述的话就是。任给一个精度e,你如果掷硬币次数足够多的话。那么出现正面的比例和固有概率值的差距小于e的概率就几乎为一了。


记住这里

不是一个定数。同样是一个随机变量。


那么具体到我们说的撒一千次硬币时。这个变量可能是501/1000, 或者是499/1000,等等。大数定律说的是如果你给我一个精度。比如说 0.1吧。那么我能保证我会找到一个足够大的N值。比如说一万次。这样在我扔超过一万次硬币时。出现的正面比例在49.9%和50.1%之间概率会趋近于一。(这里我sloppy一点了。严格的陈述就没必要了)。


所以说现在回过头来看看。怎么理解大数定律。比如说我扔一万次硬币。那么正面的百分比我可以说几乎肯定是在49.9%和50.1%之间(设若p是0.5)。这也就是为何在实际中你扔一万次硬币几乎总是看到正面的比例在这个精度中。


那你会问了。这个怎么和关于 一万次中出现五千次的概率小于一千次中五百次的现象说得通呐?这个就是要理解在这个0.1的精度中。你其实还有很多样本的。就比如一万次中从出现正面4990到5010次正面都是属于这个范畴。也就是有21个可能性。所以注重点在于这个精度本身是界定了一个独立事件之集合的概率趋近于一,而不是一个独立事件的概率趋于一。在这个集合里,每单个的概率都是趋于零的。但是他们的集合却是趋于一的。这样一想的话你就应该理解了。




浏览(1718) (0) 评论(51)
发表评论
文章评论
作者:嘎拉哈 留言时间:2014-09-11 06:40:05
华山:

【就像一大帮附和嘎子的拥趸一样。】

------ 这句话可折死俺喽。俺何德何能让别人做俺的拥趸?在这次争论中站在俺一边的,他们其实都是真理的拥趸。俺只不过是歪打正着地一脚踩到了真理上。比如,沙博以前跟俺极少有交流。尤其是vacuum 博,俺过去一直都是他政治上的死对头。而且他以前也没少砸俺。他这次也能站出来坚持真理,俺还是很敬佩的。
回复 | 0
作者:华山 留言时间:2014-09-11 02:35:34
已经说不想参与了,但看了这么多扯蛋的文字和论述,还是想讲两句:

G莫入与撇子是两个比主角跳得更凶的捧哏。以前关于这个问题的讨论部分咱没过问,所以撇子怎么用随机模拟嘎子的试验设计没读过,也怀疑它有这样的统计功底。G莫入是来跟沙公公学概率入门的,别的咱不说,学了几日,颇有长进,就下面的几句,有点说到这次争论的核心上:

---在我這樣真正的數學 layman 看來,大数定律間單的不能再間單了。用真正的 layman 語言表达,就是指像抛硬幣這樣的實驗,拋的次數越多,得到正面(或反面)的頻率就越接近理論計算出的概率。

這樣看來,嘎子和阿粥的賭盤其實輿大數定率沒有多少干系。無論要拋多少次,嘎子都百分之百贏。
---

这前一段说明从兔子开始,人们的讨论都是遵循着大数定律这个方向的。当然“理論計算出的概率”是外行话。然后嘎子来了,干什么的呢?当人们的命题是“钱币扔得越多,其正面出现的频率(与试验次数之比)越接近理论上正面出现的概率(譬如二分之一)”,他把这个命题篡改为:“当钱币扔得越多,其恰恰是正面出现试验总数二分之一的值的概率越来越小“。这两个命题本来是两码事,嘎子目的是用不相关的命题来搅黄兔子等的命题。当然他的设计也很吊诡,对大家运用的二分之一的概率值,他就用”1000次试验正面出现500次的概率“这样较含混的句子设局,不想明确指出是”正面恰恰出现500次“,也不会说”1001次试验出现500.5次的概率“,那样就容易穿帮。

如果一开始就有人指出这场鸡同鸭讲的实质,根本就不需要这么多争论。

华山参加讨论比较迟,没看出其中猫腻。在咱指出大数定律不可能错,并用空间试验(同时一次撒1000枚IID钱币,看恰好出现500次的可能)表面两种命题的不同,给人们比较直观的解释时,忽略的是在时间尺度上的试验也是IID,但很快发现这一点。当时咱期望高人(譬如沙公公)明确给指出,但没等到,他说了几句不着边际的评语,要去看什么比赛。就是本篇大论,也还是不着边际,还抵不上G莫入的几句大实话。

沙公公确实与嘎子是同类项。请看”方差小并不意味着你的变量等于均值的概率就高“,这里又把”概率“拿出来忽悠,手法如出一辙,目的是与嘎子一样,搅黄常人对方差大小的统计意义的理解。这点居然也被G莫入看出来了。真是不是一家人,不进一家门。另外沙公公言:搞概率的瞧不起搞统计,看来这也是一个不错的籍口,但现实中统计比概率更实用。按嘎子与沙公公的活法,是不能在现实中生存的。譬如两人永远买不到10kg 一袋的米,因为绝对不会一ng 不多一ng不少,那只有把嘴吊起来。另外既然沙公公是概率之人,比统计高出一大截,那就不应该”均值“长,”均值“短的。概率里面是”期望值“,统计里才叫“均值”。

对有人揪住司马不放很气愤。司马只是附和华山的观点,认为华山解释了一些事理,就像一大帮附和嘎子的拥趸一样。有什么不足也是华山的不足,与他和妨?这样的穷追猛打,不正是说明它们本意不是在讨论问题,纯属党同伐异。
回复 | 0
作者:司马懿 留言时间:2014-09-10 13:22:29
不是中俄共毒太深的,如何会忠于不离口呢?g博,你真是个俄共洗废了的。
回复 | 0
作者:gmuoruo 留言时间:2014-09-10 06:52:01
人品幫的司馬幫主,數學可不是人品,隨便你胡言亂語的。
華政委還是懂概率的,你不該為了忠於阿粥就背叛他的。
回复 | 0
作者:司马懿 留言时间:2014-09-09 19:47:20
寡人这个文革余孽还敢跳出来?基本数学问题让你搞成不可知论了,是否怀念让医学教授用肛门表的岁月?

我看博主讲的趋向0.5的概率问题,去掉情绪化的东西,就是鱼博的意思,及另一个网友的原意。嘎博本是反已有的数学及基本常识,后混成刚好二百五,对方没有同意他的意思,就硬套到别人头上,靠玩弄文字混淆视听。我判嘎博错,退出万维罢!
回复 | 0
作者:寡人 留言时间:2014-09-09 18:50:19
嘎兄与老沙交上桃花运了:对粥粥这样的flasher来说,被扒光实在是她求之不得、正中下怀的美事,你看她horny时的肉麻叫唤:嘎公公,沙和尚。。。便知一二。他在与你二位打情骂俏呢。话说回来,要想教会这些学统计ABC的主儿概率论,恐怕如同让那些练岳不群剑法的地摊把式重头开始学习正宗少林武功,应该是mission impossible!呵呵。粥粥虽说死鸭子嘴硬,但有死马陪葬,也算死得其所了。棺材里斗嘴,两人堪称旗鼓相当。
回复 | 0
作者:vacuum 留言时间:2014-09-09 17:43:12
鱼片粥:

能不能麻烦你回答一下我先前问过华山的两个问题?(他回答了,但给的答案并不让我明白,我追问了一下,然后他宣布“咱发现咱也被弯弯绕进去了”,决定宣布退出。)

===========================

我们不妨先把那俩个威力无比的“%”放在一边,能不能麻烦你演示一下,算一算:

抛1000次硬币得到500次正面的概率是多大?

抛10000次硬币得到5000次正面的概率是多大?

===========================(我的追问)====
P1 = P(同时抛1000枚两面均匀硬币,得到500枚正面朝上)
P2 = P(1枚两面均匀硬币,抛1000次,得到500次正面朝上)

你认为P1不等于P2?

根据最基本的概率的定义,P2是这样得到的:
在每次实验E中,将1枚两面均匀硬币,抛1000次,记下这次实验中正面向上的次数是不是正好为500次。重复N次实验E,发现有K次实验中正面向上正好为500次。当N趋于无穷时,P2 = K / N.
回复 | 0
作者:嘎拉哈 留言时间:2014-09-09 17:03:37
粥粥:

比知识,尤其是用抄书的办法跟别人显摆知识,不是俺的兴趣。俺只对一个人对知识的消化和理解力感兴趣。尤其是,俺这人专门喜欢喜欢骗那些喜欢露肚脐,但肚子里又没真货的小潮女的裤衩。

俺不懂离散概率密度函数的具体名字,但是俺理解了它的意思。就凭这个,俺却赢到了您的小裤衩。您说得意不?
回复 | 0
作者:鱼片粥 留言时间:2014-09-09 16:02:39
Bernoulli大数定律讨论的是离散概率。

Bernoulli大数定律的精髓在于, 当试验次数n趋向于无穷大的时候,获得的均值(减去期待值(μ) 的和大于固定的概率趋于0;也可以说 当试验次数n趋向于无穷大的时候,均值减去期待值的和小于固定的概率趋于1. 这就是为什么大数定律也被叫做平均定律,(Law of Averages)。

你们二位要么弄了个谈离散分布的二项式,要么弄了个分马牛不相干的连续概率来解释,你们怎么能够整明白? 根据嘎公公的帖子,我敢肯定他至今也没有弄明白大数定律的含义。有些博者,象工科教授,12357等等,都已经很直接的把答案告诉你们了, 大数定律就是指试验次数越多,均值(越趋于期待值(μ)。就这么简单。现代诸多工业,金融,医疗,保险,博弈等等都是建立在这个简单的道理之上。这个道理要是被你们两个傻瓜推翻了,那世界就乱套了。
回复 | 0
作者:鱼片粥 留言时间:2014-09-09 16:01:04
下班回到家,美滋滋的拈起一块双黄白莲蓉月饼放进嘴里,进屋打开电脑,看见沙老妖的帖子,我立马崩溃,两眼翻白,动弹不得。好不容易把噎在喉咙的蛋黄吐出,放声大笑。

硬币正反面是个离散概率问题,可老妖洒洒洋洋谈了一大段连续概率。怎么可以用连续概率的密度函数(probability density function)来描述离散概率问题? 密度函数只能用于连续概率的描述,不能套在离散概率的头上。离散概率的函数式只能用概率质量函数(probability mass function)来论述。 这是两个最基本的数学概念。 用密度函数来描述离散概率就如给嘎公公这样的太监吃春药,让嘎公公无法找到着力点。 呵呵。

概率质量函数是对离散随机变量进行描述,本身代表该值的概率如抛硬币,掷色等子;概率密度函数是对连续随机变量进行描述,本身不是概律,如年龄,体重等。掷硬币出现的值只有两种, 正面或反面, 0或1. 不能取连续值, 这样概率变量的概率函数被称为离散分布. 而连续值就必须以连续分布来讨论. 连续分布概率变量取一个特定值意义.

看到老妖用连续概率机关枪似的对我扫射,我立马投降!
回复 | 0
作者:vacuum 留言时间:2014-09-09 13:37:37
博主看来是科班出身,这篇博文写的很浅显易懂,非常棒。

如果能在博文中把nx, n, p和ε 再定义一下就更方便初学者理解。另外ε是任意正数很重要。
回复 | 0
作者:嘎拉哈 留言时间:2014-09-09 10:41:33
接着用layman的语言,解读俺上面的评论。如果以贪官为例做个类比,上面的例子表明,一方面,20%的贪官拥有了97.5%的财富。但是另一方面,平均分摊到每个贪官身上的财富却又很低,只有 0.975/200=0.0048.其中,贪得最多的(即出于5-5开的)那位,实际贪污了0.0252,即平均贪官贪污数的 0.0252/0.0048 = 5倍。即便是5倍,这个最大贪官贪污的数额仍然很低。因为总共有200个贪官呢。

表面上看,按照大数定律,随着N的增大,这个状况应当有所改变,比如,概率密度函数越来越尖锐,那个所谓精度(这里是0.1)会越来越小,因而贪官的数量也会越来越少,最后,当N趋于无穷大时,所有的财富(100%)必然会全部集中在那个处在5-5开位置的最大贪官一个人身上。按照粥粥的理解,这时候,只要把这个最大贪官一劈两半,那不就得到0.5了吗?

其实这是一个误解。事实上,随着N越来越大,方差越来越小,贪官的数量反而会越来越多。最大贪官的贪污数额反而也会越来越低。
回复 | 0
作者:沙之舟 留言时间:2014-09-09 10:32:21
小鱼,为什么拒绝再回复?纯学术讨论我们还是避免意气用事吧。 从你对大数定律的理解来看我认为你对概率到底是个什么还是存在一定偏差的。

比如你这句话
“ 一万次中出现五千次的概率小于一千次中五百次的现象说得通” 论点。这个论点只有在谈离散概率时才能够成立,这个定论违背了大数定律,“

反应了你仍然以为大数定律讲的是撒N次硬币其中有N/2正面的概率趋于1的。这一点我已经反复说明了大数定律说的趋于一的是关于一个样本空间中集合的概率。而取N/2只是这个集合中的一个分子。这一点如果你读得懂大数定律是怎么证明的话就会了然于心了。

事实上当N趋于无穷时它的样本空间也在无穷增加结果导致其中每一个单一事件的概率都是趋于零的。但是他们的累积概率还是一。

至于你说不是离散概率的理由。这一点更充分反映了你对概率的实质理解还有偏差。

那好我就举一个最简单的连续空间的概率问题吧

0 到 1之间的均匀分布。

他的定义就是 其密度函数为 1. 即 f(x) = 1 for 0<=x<=1 and 0 everywhere else.

这个应该是再简单不过的连续函数了吧。

那么这个随机变量的 均值 即 E(X) = integal(xdx) = 1/2.

如果我问你 X= 1/2的概率你会怎么说?你认为这个概率是多少?如果你懂得概率的真正含义的话你就会明白

一。 P(X=1/2)根本就是零。

二。然而如果你问 P(|X-1/2| < 0.1)的话, 那么这个概率就是Integal(dx) 从1/2-0.1 到 1/2+0.1因此就是个很简单的 0.2.

所以在这个连续概率中。你挑出任意一个孤立点的话。随机变量等于这个数的概率都是零。所以你只有在讨论某一个度量大于零的区域时你的概率才会有大于零的数字。

这也就是为何在连续概率里我们用 accumulative distribution function来表达概率的分布。在这里这个概率公式就是 F(x) = x for 0<=x<=1. 它表明的意思是你如果从0到1之间随机抽一个数的话这个数在0到x间的概率是x。那么密度函数是什么。在这里它是累积分布函数的导数。即 1.

那么这个密度函数的意思是什么?它可不是说你等于x的概率是一。它是描述如果你如果抽出一个数是在这个x, 比如说 1/2 附近的话。那么抽取的概率就几乎可以用他的密度函数在1/2的值即 1 乘以 这个很小的局部, 即 dx来代替了。

所以你可以看到如果你想要用连续的概率来争辩的话就更说明我在原文中说的这句话了。即单看每一个结果其概率都是零,然而其集合的累积则不是零。这个其实正是微积分的实质了。
回复 | 0
作者:嘎拉哈 留言时间:2014-09-09 05:40:17
沙兄:

俺本来打算就这次赌博事件写一篇搞笑的,题目叫做《嘎老妖设残棋智骗小潮女》,其中有一部分俺觉得太过严肃了,决定搬到您这里。粥粥这个贪婪的小潮女是该好好教育教育了。否则迟早会把内裤都输掉,光着屁股回家。

大数定律其实根本就没那么神兮兮。伯努利之所以花了二十年时间证明大数定律(比雪夫不等式这玩意会让他少走几十年的弯路), 其目的就是要证明一个人人都在用,但却是缺少理论基础的一个常识,即随着重复实验的次数增多,样本的平均值这个随机变量,其分布总是越来越稳定在某个固定值附近。同时它的离散度(方差)也会越来越小。平均值还有另外一个特性,那就是不管是什么分布的独立随机变量,其平均值的分布都形状都快速向于高斯分布的形状靠近。这便是中心极限定理。

粥粥所犯的错误,也是人们普遍常犯的一个直觉错误。其实这也正是俺在兔子那里的那个评论的主要目的。粥粥如今反咬俺一口,说俺不懂或者反对大数定律。真能搞笑。严格地说,这个直觉错误的关键,在于没有意识到, 大数定律意义上的5-5开,并不是严格意义的5-5开,而是一个松绑意义的5-5开,它指的是一个范围。

以粥粥自己的辩护为例:他至今仍然将:

P{n=1000} = (|A{n=1000}-0.5| < 0.1) = 97.5%

不假思索地解读为:“抛1000次硬币,出现5-5开的概率为97.5%“

其实,这个公式的正确解读应当是:”抛1000次硬币,正面硬币的次数介于4-6开到6-4开之间的概率为97.5%". 或者:“抛1000次硬币,出现正面硬币的次数介于400到600之间的概率为97.5%”

俺这个残局的猫腻,就是打算骗骗像粥粥这样的小潮女。可笑的是,在她把内裤输给了俺之后,至今仍然不知道怎么输的。
回复 | 0
作者:gmuoruo 留言时间:2014-09-09 05:17:47
阿粥,誰不知道你早就輸了?但等到連華山都知道你輸了,你該承認了才對。沙博又已經在數學上證明了,你還是看不懂。還提智商,笑死人了。
回复 | 0
作者:gmuoruo 留言时间:2014-09-09 05:03:16
沙博,你對極限的解釋是很清楚。第二个表达方式也要用到極限概念,也就是給出任意一个數 e (e> 0),都可找到一个 N,使得 Nx/N - u 小於 e ,因此 P=1。
這是我能理解的極限了。
回复 | 0
作者:鱼片粥 留言时间:2014-09-09 04:41:23
这位姓G就像个苍蝇,一直围着我这个蛋找裂痕,在我和嘎公公辩论都结束了,还在到处打听,“谁输了赌局?” 他的智商可想而知。 呵呵
回复 | 0
作者:鱼片粥 留言时间:2014-09-09 04:25:12
老妖,

你在辩论中很多表述不象是个行家,你先前的自我吹嘘无法帮你掩盖你辩论出露出的破绽,什么偏差不能反应概率,所有样本的均值无法取得等等。这些论调无论是“用你的数学”,还是用“我的统计” 都无法验证。不过这都还是小问题。你最大的漏洞还是先前提到的 “ 一万次中出现五千次的概率小于一千次中五百次的现象说得通” 论点。这个论点只有在谈离散概率时才能够成立,这个定论违背了大数定律,我已经演算给你看了,它不成立。你除非能够用你的数学验证你的结论,否则,任何辩解都于事无补。

你我素昧平生,从未交过手,所以没有夙仇,谈不上谁和谁对着干。科学没有亲疏远近,科学只有对错。你能够验证你的结论,你就是对,否则你错了,就这么简单。

如果你回家把咱们之争公正的摆在你也学数学的二公子面前,我相信他会告诉你答案的。

上班去了,不再回复。
回复 | 0
作者:hare 留言时间:2014-09-09 00:45:25
写到这里,我又想到老几笑我的话“绝对的绝对”,是哲学的,范例,的真正本体。

这是什么意思?这就是说,一般的对立,如数学上的“无限与有限”,都是对立而生,共同存在,有你才有我,与君共存亡。而哲学或范例的无限不是这样的-这就是“绝对”的意思。

(这段话如果听起来是天书或胡言,是正常的,FYI)

补充
回复 | 0
作者:hare 留言时间:2014-09-09 00:36:42
谢谢老沙的“数普”!

我感兴趣这段话:

“其实在数学里。无限的概念永远是通过有限来表达的。采用的方式就是通过描述精度的不断改进这个过程。学数学最常用的句话就是任给一个精度值。如果我能找到一个足够大的N使得任何一个这个N以后的数字都与我们认定的那个极限值的误差少于这个精度的话那么这个序列就是趋向于这个精度值的。”

这也就是说,数学的所谓“无限”,是由“单纯重复简单的有限值”来模拟无限的。所以,我认为,这种无限不是真正的无限。

哲学上的无限显然不是这样,也不能是这样。首先数学的本质是在“质”的基础上的规则。也就是说,数学的一切计算都基于“数”的存在。而数,就是一个“分割”,就是一个“定量”(黑格尔)。而哲学则要突破这个限制。

比如我谈思维的“无限性”。我不可能用“有限”,或“存在”的“质”,或“数”,或无论什么东东来定义。因为我要研究的正是,这个“质”或“数”,是如何形成的。用黑格尔的话说,就是“纯量”,的形成和发展(我的话)。

总结地说,真正的无限,或哲学的无限概念,并不能以“有限”或“数”来定义。而恰恰要突破这个“有限”性,来追求在其背后的什么- 我都不敢写“东西"了,因为“东西”,就代表了质,或数的存在了。

简此
回复 | 0
作者:沙之舟 留言时间:2014-09-08 22:45:14
还记得我原文写的关于无限趋近一个数的描写吧。我的意思是你怎么通过那个来描述什么是lim(Nx/N)=u的含义。这样一说你就又牵扯到e了。
回复 | 0
作者:gmuoruo 留言时间:2014-09-08 22:28:06
呵,呵,這不就是我私下認為大數定律的更好表达方式麼?你一再強調 e 不能等於 0,但我覺得只是因為表达的方式不是最好, 概因若 e=0,那 < e 豈不成了負數了?可是不許 e=0 又會讓人誤以為nx/n 永遠不可能等於 p。

而現在這个表达式在我看來更好。我用 layman 的語言理解是如果你能拋無窮多次的硬幣,則得到正面(或反面)的頻率必等於理論計算的概率。這樣的結果符合我們的直覺。
回复 | 0
作者:沙之舟 留言时间:2014-09-08 22:25:32
再给老郭加点料。如果你有兴趣的话可以再研究一下中心极限定理。这个就给出收敛于均值的某些性质了。即正态分布的情况。

这个我在当初右撇的博文后面已经提及了。

通过正态分布可以大致描述给出一个精度时更细致的些分布。当然这是不是以简单的均值和概率的差来说了。

anyway你如果有兴趣可以看看。

得,这本来是说layman的我倒是越扯越远。就此打住了。不搞数学多年了。现在凭着点当年的底子在这硬撑呐。再往深了好多东西不翻书恐怕要打奔儿了。刚才在facebook上和儿子聊了聊。感觉他已经在不少方面比我门清了。哈哈。
回复 | 0
作者:沙之舟 留言时间:2014-09-08 21:58:11
老郭。呵呵其实你应该在多想一下。为何不把那个lim放到P里边呐?



<img src="http://upload.wikimedia.org/math/7/7/f/77fd8f4aee1576f5a4512f6b0d63a71f.png">

你看看你能描述这个说的是什么么?

其实这个是强大数定律。证明要比弱大数难。

我看你能否咬文嚼字的说出这个是什么意思来吧。
回复 | 0
作者:gmuoruo 留言时间:2014-09-08 21:46:49
哈,哈,多謝。我咬文嚼字只能到這个程度了。有了你的解答,我若再想繼續咬文嚼字,也知道大概從哪裡下口了。
統計學書多好的少,對於愛咬文嚼字的人來說讀起來很痛苦。好在不常需要,找个公式套套也就夠了。
回复 | 0
作者:沙之舟 留言时间:2014-09-08 21:26:42
老郭。关于你另外的问题。即算出N在多大时能达到某个给定的e精度。

是的。这个可以大致估算。而事实是伯努力大数定律就是通过这个估算法得出来的。使用的是方差=p(1-p)的事实然后运用切比雪夫不等式估算出 >= e的概率会趋向于零所以其补集就趋向于一了。通过那个你可以得出一个大概的N值。当然并不一定是最佳的N值。记住,这里的目的需要的是证明结论。

其实统计学里更注重的是怎样能够算得更好等实际问题。
回复 | 0
作者:沙之舟 留言时间:2014-09-08 21:16:51
老郭你这个问题算是问到点子上了。赞一个!对于非数学专业的来讲这个不容易。

为何在大数定里里这个叫做依概率收敛。为啥呐。就是像我说的。你完全可能根本就没有任何一个变量会取值这个概率P。所以这也就是为何所有大数定里给出具体定义的时候都要写成这种形式。

注意,这里的用语可是任给一个 <img src="http://upload.wikimedia.org/math/e/7/7/e778429d8769714354b1994984a23fe5.png">

任给是什么意思, 就是说随便你取什么精度。0.1, 0.001 whatever,但是这个数却不等于零。

现在应该领教数学里为何咬文嚼字了吧。呵呵
回复 | 0
作者:沙之舟 留言时间:2014-09-08 21:07:16
小鱼呀。听我劝。好好把我讲的这些概念搞懂一下对你只有好处。

这两天咱俩搅嘴皮互相call names多了点。容易引起为斗气而斗气。你要是因为这个堵心的话我道个欠。老沙我早就不跟人因为左右呕气了。好长时间不来万维也是因为在其他地方为我家老二马上要上大学了忙活。

我劝你再回头把我的贴子读一下。

我知道你们搞统计的有时比较喜欢把问题简单化说说。那个也没什么大错。但是如果你想深一步考虑的话你就必须要从数学上本来是怎么严谨的定义这个东西开看。
回复 | 0
作者:gmuoruo 留言时间:2014-09-08 21:04:40
沙博,多謝。我能看懂那个數學公式想表达的意思,和我“用真正的 layman 語言“給的解釋等价。

但我覺得那个公式看似複雜,卻又不足。既然 n 趨於無窮大了,e 就變得沒有必要了,因為無任 e 取什麼値, limP 也必然會等於 100%。

更 informative 的公式應該是給出 n 和 e,p 之間的關系。比如 e 若取 0.1,n 該取什麼値才能保證 p 达到一定的値(比如說,99.99999%)。

不知有無這樣的公式?

至於賭盤,嘎子贏了,阿粥輸在語言理解力的不足。當你說 ”知道样本空间里所有样本可能根本就没有取均值的可能性“,我知道你在說什麼,說的非常嚴謹,但他犯了於嘎子設賭時同樣的錯誤,沒能理解你這句話的準確含意。
回复 | 0
作者:沙之舟 留言时间:2014-09-08 20:53:58
懂得基本逻辑么。粥粥。

我那是给你举个反例。你自以为算方差就能代表取均值的概率了。我是告诉你你那个理论不对。根本没有这么一说。

要说去(N/2)的概率早就算出来了

就是

(1/4)^(N/2)*N!/((N/2)!*N/2)!)而这个数是随N增加而递减的。这个就是扔N次硬币取值 N/2的概率。所以这个概率一直在减少

我已经在原文里解释了。尽管这一概率在一直减少而且-》0.但是由于越来越多其他的取值也越来越接近 N/2所以整体的满足 在 N/2的精度以内的概率越来越高。

明白了吗你给榆木脑袋!
回复 | 0
我的名片
沙之舟
注册日期: 2011-07-01
访问总量: 218,872 次
点击查看我的个人资料
Calendar
最新发布
· 用layman's terms说说大数
· 给司马懿网友解释华山错在哪里。
· 随笔:埃及二次革命及身边的人和
· 视频: 哈耶克的一生及思想
· 爱国主义是美德还是邪恶?麦克桑
· 黑格尔对中国科学和哲学的看法
· 推荐慕容青草所推荐的麦克桑德儿
分类目录
【好文转载】
· 爱国主义是美德还是邪恶?麦克桑
· 推荐慕容青草所推荐的麦克桑德儿
· 右派的郁闷发言。(转贴一个右派
· 好文转贴: 纪念方励之先生,兼
· 转贴一篇袁剑的文章。地方政府与
【微博】
· 视频: 哈耶克的一生及思想
· 震惊,加州高铁一期工程竟然交由
· 要不俺也跟风纪念一把花见草?
· 我的哥们儿崔哥应我的邀请要来圣
· 为调节左右关系。老沙建议万维左
· 双簧管还是长笛。你更喜欢哪一个
· 上影译制厂当年译制的“悲惨世界”
· 以莫扎特之安魂曲为康州死难者哀
· 微博: 不得不叹服奥司令的手段
· 微博。今晚总统竞选辩论(罗老板
【旧文存档】
· 海一代之给海二代陪练 二:
· 退出江湖前的最后挣扎。 夜半闻
· 中秋陈年老词之三。六洲歌头。中
· 中秋陈年老词之二. 采桑子
· 陈年老词一首。水调歌头 中秋
· 聊文化想起当年写的首诗
· 旧文存档。当年玩饭太稀时所写 “
· 纪念唐山大地震。曾经的回忆录。
· 当年之作: 恐龙皇后贾南风
· 旧文存档: 浅谈中国古代未出现
【忆往昔峥嵘岁月稠】
· 二十七年前的今天
· 回忆上高中还是男女分班时的青葱
· 想起了当年干的杀生的事儿
· 说说咱当年被老黑抢的经历
【体育运动】
· 海一代之给海二代陪练
· 超级杯后说文化
· 左翼功力日趋成熟
· 枪口抬高一寸。结果就会不一样了
· 如何减少比赛中的心理压力。
· 否极泰来: 左派完胜!
· 乐极生悲。
· 今天二子打球时惊险一幕
【诗歌散文】
· 借绿岛的图上首以前写过的七律
· 秋天的赞歌,秋天的豪情。望海潮
· 蝶恋花 入秋
· 纪念六四三首
· 网名作诗几首
· 声声慢, 八戒哀
· 新诗译旧诗。
· 三月忆三月
· 当年的游戏
· 经白兄提醒,看冬儿剑门游记。想
【杂谈】
· 用layman's terms说说大数
· 给司马懿网友解释华山错在哪里。
· 随笔:埃及二次革命及身边的人和
· 黑格尔对中国科学和哲学的看法
· 领略大师风范
· 用黑格尔的哲学来解释黑格尔的中
· 随笔:从波士顿爆炸案的哲学思考
· 看来左派还是要右派来帮助的。随
· 日本连续剧“坂上之云”观感
· 共和党的出路在哪里?
存档目录
2014-09-07 - 2014-09-08
2013-07-08 - 2013-07-08
2013-05-15 - 2013-05-29
2013-04-17 - 2013-04-30
2013-03-02 - 2013-03-02
2013-02-07 - 2013-02-28
2013-01-05 - 2013-01-14
2012-12-16 - 2012-12-16
2012-11-05 - 2012-11-13
2012-10-01 - 2012-10-23
2012-09-18 - 2012-09-29
2012-07-24 - 2012-07-24
2012-06-22 - 2012-06-22
2012-04-06 - 2012-04-13
2012-03-15 - 2012-03-28
2012-02-06 - 2012-02-16
2011-12-12 - 2011-12-14
2011-11-16 - 2011-11-24
2011-10-04 - 2011-10-13
2011-09-01 - 2011-09-17
2011-08-02 - 2011-08-30
2011-07-02 - 2011-07-31
 
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2024. Creaders.NET. All Rights Reserved.