許多人不知道數據並不必然代表真相,很多時候,你統計的數據與你要調查的結果之間沒有任何聯繫。貌似真實的案例後面,是一個統計學魔鬼在玩魔術,魔鬼的名字叫“倖存者偏差”,一直為騙子保駕護航;也是很多“大師”們的生存密碼
老高按:有人的地方就有忽悠。 什麼叫“忽悠”?維基百科說:“忽悠”一詞來自東北方言,普通話作糊弄或唬弄,其字面意思,是讓人陷於一種飄飄忽忽、神志不清、基本喪失判斷力的狀態。日常生活使用時通常解作“坑蒙拐騙,誘人上當”。忽悠比“詐騙”一詞溫和,具有一些調侃玩笑的含義。 有忽悠的地方就有反忽悠——探究那些忽悠何以得逞的伎倆,探究被忽悠者上當受騙的心理誤區,探究如何識破、防禦和戳穿忽悠的有效方式。 我今天要推薦下面這篇文章,就是這樣的一個反忽悠利器,幫助我們在紛至沓來令人眼花繚亂的信息、圖表、數據、照片、視頻、故事中,去偽存真,保持定力。
騙子密碼:倖存者偏差
量子學派,鏈聞ChainNews
引語 倖存者的辯護詞
疫情過後,一定會有很多的騙子成為“大師”,也有很多食材成為“神藥”。 當然,也會有很多當事人或者親友為這些從未上過一線的“大師”和“神藥”背書。 我發了高燒的七舅姥爺,正是喝了大師指點的豆漿才康復的。 我三外甥的女兒已經感染了,也是喝了“龍井茶”才逃過一劫…… 這些為大師辯護的人,並不一定全是水軍,他們不是騙子,甚至是一個溫和善良的人,可能真心認為大師救了自己一命,“神藥”真的讓很多人躲過了這次疫情。 只是他們不知道這些數據並不代表真相,這些貌似真實的案例後面,是一個統計學魔鬼在玩魔術,這個魔鬼的名字叫“倖存者偏差”。 正是這個魔鬼,一直為騙子塗脂抹粉,保駕護航。 它是很多“大師”們的生存密碼。
01 你越認真,離真相越遠
倖存者偏差又叫“倖存者謬誤”,反駁的是一種常見邏輯謬誤,即只看到經過某種篩選之後的結果,忽略關鍵信息。 這涉及到數學的一個分支,也是統計學中的概念:越是認真觀察眼前的真相,你離真相越遠。 騙子的辯護者肯定不會這麼認為,這些案例就發生在自己身邊呢,不可能騙人。 他們只看到了一部分倖存者,卻沒意識到這些倖存者只是極個別的數據。 以北京地鐵為例,很多人在早高峰和晚高峰的時候,都會在前胸貼後背的沙丁魚罐頭型地鐵里,感受城市海量人口。每天擠這樣的地鐵,很多人肯定會認為車票讓地鐵公司賺大發了。 地鐵每條線光是開發的投入就需要上百億,再算上其他的人工、日常運營與維護費、銀行貸款的費用,遠不是通過客流量的票價就可以回本的。而且地鐵是國家民生工程,相當於公益項目,票價不能過高。所以地鐵入不敷出就成了常態。 上班族之所以認為地鐵總是人滿為患,是因為每次他們都在客流量最大時,比如早、晚高峰期乘坐地鐵。但地鐵客流並不是穩定的,很多時候“空車”現象也並不少,只是那時候大多數人都在上班,並不知情罷了。 你觀察得越仔細,體驗得越多,其實得到的結果偏差越大。 在日常生活中,最明顯的例子就是“我親戚吃了某偏方好了”或者“我一個朋友去找了這個老中醫”等等,這些你認為非常準確的數據都屬於偏差數據,並不能得出一個理性結論。
02 統計學笑話:沒來的同學舉手
“幸運者偏差”的統計概念,最開始是來自於二戰期間。 “二戰”期間,為了加強對戰機的防護,英美軍方調查了作戰後倖存飛機上彈痕的分布,決定哪裡彈痕多就加強哪裡。然而統計學家沃德力排眾議,指出更應該注意彈痕少的部位,因為這些部位受到重創的戰機,很難有機會返航,而這部分數據被忽略了。事實證明,沃德是正確的。 很多時候你統計的數據與你要調查的結果沒有任何聯繫,甚至與你要調查的結果正好相反。 再舉幾個例子: 例子 1:有記者在春運的候車廳里,採訪買票情況,得出結論:雖然春運票不好買,但大家都買到了票。 例子 2:淘寶上賣降落傘的商家都沒有差評。 例子 3:大學裡有個全校出勤率第一的老師,她的訣竅就是每次點名都說:“沒來的同學舉手”。 沒來上課的同學不會舉手,想要給降落傘差評的人再也沒有機會打開淘寶。這也說明了“幸運者偏差”在統計上的本質:其統計結果是經過篩選後的結果,並不是隨機的,因此也不具備普適性,所以不要輕易相信那些直銷者的話。 所以,如果你真的以為“六個核桃”真能給人補腦,那麼你的智商也就停留在剛剛直立行走的年代。
03 沉默的大數據與“死人不說話”
你的朋友專程來你的城市看你,三天后你開車20公里送他到機場。 你對他招手說道:“兄弟,一路順風,注意安全。” 這句話聽起來沒有什麼問題,但事實上,這句話更應該由他來對你說,而不是你對他說。 根據對不同交通工具的死亡人數統計,每行駛十億公里,小汽車死亡人數為3.1人,水路2.6人,鐵路0.6人,公交車0.4人,而飛機只有0.05人。 被你送上飛機的朋友,其實比即將開汽車回家的你,更安全! 那麼,為什麼我們會有飛機失事率高,不安全的印象呢? 因為飛機失事的每一次數據都被記錄。2014年,馬航MH370失事,鋪天蓋地的新聞報道,甚至讓許多人都不敢再乘坐飛機,一時人心惶惶。四年後,關於馬航MH370零星碎片的消息,仍然是網友們的關注焦點。 汽車的事故非常多,但報道非常少見,死人不會說話,大數據在沉默。稀鬆平常的事情,媒體是沒有興趣報道的。 當你或你的親人得病之時,是不是經常有人會適時出現,並一本正經地推薦保健品或者給你一些偏方?推薦完,還斬釘截鐵地告訴你,這個絕對好,絕對有用,我家的誰誰誰就是這麼治好的。 他不知道很多人吃了這些“糖水”後並沒有任何起色,有些人甚至因此耽誤了正規治療時間,最後無可救藥後悔莫及。 很多冒出來被報道的騙局,因為“死亡數據”在說話。
04 期望值是“倖存者偏差”的幫凶
總聽說一些神奇偏方,還有什麼江湖神醫, 但卻很少聽到有人說哪家醫院某某專家是華佗轉世。 為何在這一點上,“倖存者偏差”表現得比較明顯? 原因在於,大多數人對醫院的期望值較高,理所應當地認為,醫院一定能治好我們的病。如果我們在正規醫生的診斷下,治好了病,很少有人會去宣傳這家醫院,反倒是這家醫院沒有達到我們期望的效果,我們才會表現不滿和失望。 而相比之下,對於這些偶爾得來的治病渠道,用戶期望值較低。對偏方、神醫等抱着試試看的心態,就算沒有效果,也不會到處傳播。如果有效果,哪怕是出於零丁的心理安慰,我們也會覺得有用,如果它恰好能讓你有所康復,那麼你便很有可能會大張旗鼓四處宣傳。因此,哪怕100個人中,有1個人被這個偏方治好,這個人也會成為該偏方的“忠實粉絲”,為它熱情宣傳,這是任何互聯網產品都很難達到的水準。 這裡同時也涉及到了一些另外的心理因素,每個人都希望在他人面前提升自己的價值感,其中就體現在可以為他人提供獨到的價值信息, 而偏方就剛好具備價值獨有性。
05 倖存者偏差公式
稍微理性思考下,我們就可以總結出一個倖存者偏差公式。

這個公式非常簡單,f(x) 代表了事件的正常概率,x是與該事件相關的有效數據。 很多時候,x的數據是9,而在騙子這裡被偷換為0,10%的概率被吹噓成100%; 有些時候,x的數據是99,而在“大師”這裡被取代為0,1%的概率被吹噓成 100%。 所有的騙子都會強化一些特殊案例,目標就是讓人忽略那些“沉默的有效數據”。倖存者偏差的統計中,人們總是關注自己看得到的事物的特徵,但是忽略看不到的事物的特徵。亦或者是忽略了無法倖存下來的事物的特徵,因此會看不到導致結果的實際原因,得出各種錯誤結論。 每個人大腦的理性程度不一樣,但在很多事情上,由於有些人將規避危險的系統人為地放大,就容易暫時性地丟失理性,如牛一般被牽着鼻子走,以至於完全感知不到我們正在掉入“倖存者偏差”的陷阱之中。
06 利用倖存者偏差,你也可以成為大神
那些市場上的騙子,大部分時候就是在利用倖存者偏差理論。 有一個古代的故事,有一位大師自稱能隔空改變孕婦肚子裡孩子的性別,如果生下來的是兒子,那收的費用就不退了,如果生下來的是女兒,那就全額退費,生意特別好,很多渴望兒子的人對他感恩戴德。 利用同樣原理,你也可以混個大神噹噹。 以賭球為例,方法也很簡單。 在第一輪賭球中,你把輸贏兩種結果,各分成50條短信,發送到100個人手中,等到比賽結束,一定會有50個人,拿到了正確的“預言”。第二輪賭球,再各發25條,到上一輪的50位“幸運者”手中,又會有25個人拿到正確的答案。以此類推,多輪下來,“倖存者”就誕生了。如果剛巧,這位倖存者並不知道“倖存者偏差”的理論,那麼恭喜你,他一定會心甘情願奉你為“大神”。 這也正是倖存者現象,世界的關注點永遠在那些偶然的成功者身上,卻忽略了上萬倍沒被概率選中的失敗者。 這是騙子經常用的手段,不談基數的概率都是耍流氓,我們總聽說股神賺了多少,卻不知道就住在自己隔壁的老王賠了多少。這是因為“倖存者偏差”的存在,讓我們只能看到別人的成功,而更多失敗的人,我們選擇視而不見。
07 如何躲過倖存者偏差?
倖存者偏差,表面上看屬於數理統計、邏輯學的範疇,但很多時候也涉及人性。 (1)首先要意識到了“沉默證據”的存在,你才有機會獲得更全面的認知。看慣了朋友圈、抖音的朋友總是容易產生一種想法:買名牌包、吃豪餐、國外旅遊已經是中國常態。但拼多多的崛起讓“沉默證據”發力:原來購買廉價產品,為了幾毛錢動員砍價的人,才是中國人口最廣群體。 耳聽不一定是真,眼見也不一定為實。需要打破慣性思維,躲開顯性證據,看到背後的隱形證據。 (2)讓死人說話。以2000多年前羅馬的思想家西塞羅講的故事結尾:有人把一幅畫給一位無神論者看,畫上畫着一群正在祈禱拜神的人,並告訴他,這些人在隨後的沉船事故中都活了下來。無神論者淡淡一問:我想看看那些祈禱完被淹死的人的畫像在哪兒?歷史上騙子很多,如果這些人真的能復活過來說話,這世界上的大師要少一大半。 (3)學好數學,學好統計學。舉個例子,基金行業會對外宣布,過去10年,基金行業的整體收益率超100%,你是不是覺得買基金肯定賺翻了?實際上,如果你懂數學,你就能發現有問題:基金行業統計的,全是現在市場上活着的基金,那些不賺錢死掉的,都沒算進去。如果把死掉的那些也考慮進去,那基金的整體收益率其實很一般。 雖然對許多人來說,計算過程枯燥乏味,但這是對理性思維的鍛煉。數學將我們的邏輯編織得更加緊密,能夠看透複雜現象背後的本質。同時,去除偶像崇拜,摒棄神秘現象,控制人性貪婪,將有效防止被倖存者欺騙。
結語 不是每個人都是倖存者
幾十年來,從505神功元氣袋到“萬能之藥”的板藍根; 從馬俊仁的中華鱉精到“從農村包圍城市”的三株口服液; 從號稱補血的紅桃K到正在吸血的各種保健品; 從宣稱祛風除濕的鴻茅藥酒到一鳴驚人的“雙黃連”…… 很多都利用了“倖存者偏者”原理,銷量越大騙得越多。 理解倖存者偏差,你會在神藥的眾聲喧譁里,注意到“沉默的螺旋”的無聲表達; 理解倖存者偏差,你就會在騙子的群情騷動中,去尋找隱藏的真相和客觀答案; 理解倖存者偏差,你就不僅能夠看到馬雲“一將功成”輝煌,也能看到“萬骨枯”創業者; 停止對倖存者的迷信,你聽到的那些宣傳,後面有無數同類的哭泣。 別再相信那些神奇的秘方了,你很容易被倖存者偏差欺騙。 如果你認為倖存者的答案也將屬於你,這將可能是你一生最大的不幸。
近期圖文:
是“文明古國”,還是野蠻古國? 社會要知識分子幹嘛?就用來添亂嗎? 跟着感覺走的心理分析:雖不屬實卻合情 裝睡的人叫不醒,真睡的人就能叫得醒? 我們因為什麼對李文亮之死感到如此悲憤 疫情當前,別丟了人性的根本 控制輿論騙人害人,最後被騙受害者是自己 歷史學家和政治家不同的地方 現在讀《2019年中國文化紀事》真像白開水 白樺忌辰一周年:這一隻早叫的公雞
|