|
| 人腦比電腦到底強在哪裡? |
| 自從上世紀中期電子計算機問世以來,“電腦能不能代替人腦”就是個熱門話題。半個多世紀以來,電腦的能力日新月異,不僅在計算,信息儲存等工作遠遠超過了人腦,甚至在國際象棋上也首次打敗了人類頂尖高手。那麼電腦能不能全面趕上人腦的功能呢?
當然,比起人腦中神經元的數目,電腦還是有差距。有人樂觀地認為,在未來幾十年中,電腦的運算和儲存能力都會趕上人腦,而在功能上趕上人腦也就為期不遠了。當然,也有另一派觀點,認為無論電腦如何強大,都不可能代替人腦。這一派中有從哲學上找根據的(例如電腦不可能有“靈魂”或“自由意識”),也有從科學原理上論證的(例如說人腦包含有“不可計算過程”以及援引哥德爾不完全性定理)。從實用的角度說,更有意義的問題是:人腦在結構上有什麼優越性?計算機能不能向人腦學習?雖然人腦和計算機有太多不同的地方。但是能不能找出一些共性,來比較這兩者呢?
二十幾年前,“神經網絡”曾經是個熱門研究領域。從神經元的結構和機理出發,科學家提出了一個大大簡化的網絡模型。它的結構與數字計算機很不一樣,但具備學習和模式識別的功能。人們曾經希望這個研究方向能大大提升計算機的能力,特別是在人工智能和認知方面。但是到現在,它只在一些特別的場合中被採用。
神經網絡是從底層結構入手的。另一個途徑是從最高層結構入手來了解大腦。《為什麼選擇本書?》(“Why Choose This Book?: How We Make Decisions” by Read Montague)就是這樣一個嘗試。本書的作者是研究神經科學的教授。這本書在《自然》雜誌上兩次被介紹【注一】。下面,我們就基於這本書,來看看人腦的評估和決策過程,也就是根據外界情況權衡各種行動選項,而選擇合適的行為的能力。
一般人都認為人腦比計算機能力強大,是因為神經元的數目比目前計算機的元件數多。但是人腦其實有很多限制。它的功耗比計算機低得多,運算速度也很慢。但是由於它精巧的結構,它有很高的效率,所以在功能上比計算機強大得多。
其實人腦決策時,面對的是非常困難的問題。比如,在超級市場裡選購牛奶。牛奶有低脂,全脂,味道,營養和價格都不同。每種可能還有不同牌子,不同大小的包裝,不同的過期日期。。。與這個決策有關的信息還有家裡各人的口味,日常用量,冰箱裡的可用空間。。。要把這些信息都納入考慮範圍,最後得出最優的選擇,即使強大如人腦,也是不能勝任的。但是另一方面,生活中也並不需要絕對最優的解。人腦的決策過程實際上是優化與效率的折衷。
計算機與人腦的一點重要不同,就是沒有“偏見”,也就是完全用邏輯,理性的態度對待和處理數據,沒有“主觀”的預設立場。這一點是長處,因為它能做到真正客觀的優化。但也是短處,因為無法利用經驗來縮小搜尋空間。而人腦卻是有“偏見”的。造成偏見的下意識,其實在思維過程中起着重大作用。在這裡,我們不談整個下意識,而只考察一個極其簡單的機制:由多巴胺實現的獎賞引導機制。
所有優化問題,都有一個目標函數,也就是優化的對象。我們選擇的行動能使目標函數的取值越大,這個行動就越好。這一點,人和計算機是一樣的。但人腦的目標函數與計算機之不同,在於它不是精確定義的,而只代表一個總的方向和偏好。例如,在下棋時,我們選擇一步時並不知道從此以後一直到贏的計劃。但我們“直觀”地覺得,這一步(以及可以預見的下幾步)以後,我們能達到最佳的“形勢”。而且,“價值”和“目標”是貫穿在人的決策過程的始終。每個選項和策略都有相關的價值。在評價不同選項而形成行動計劃的運算中,相關的價值也同時被列入評估之中。
在最高層,人的基本目標是與生存有關的條件,如食物,安全,性等。這些目標可以說是通過進化過程設置的,相對固定的。那麼這些目標是如何影響決策過程呢?多巴胺(Dopamine)在其中起了重要作用。多巴胺在大腦運作中有很多功能,其中的中腦多巴胺神經系統(Midbrain dopamine neurons)是關於基本目標的“信使”。當感知系統傳來的信息表明這些基本目標得到了更好的滿足(比如出現了新的食物),這個系統的活動就會增加,從而向全腦“廣播”這個“獎賞”的信息。影響多巴胺的不僅是外界條件,也有大腦本身對於未來的估計。所以如果大腦在評估一個選項,而其預見的後果是改善生存條件,那麼多巴胺也會給出“獎賞”,而使得這個選項的價值提高,也就是更容易被採納。作為所有高層目標的通用信號,多巴胺也是各個不同目標之間權衡所使用的“貨幣”。
在這個最高層之下,前額葉(prefrontal cortex)和紋狀體(Striatum)負責給出更具體的目標。這些“次級目標”不是固定的,而是隨情況變化的。例如,在“取得食物”這個基本目標下,具體的目標可以是“找到飯店”或“到廚房找零食”。前額葉通過在多種選擇之間的評估來設定最合適的目標,並保持這個目標一段時間,以便指導行動。它能預見目標的結果,從而與多巴胺神經細胞相互作用:它不但接受多巴胺的“指導”,也通過自增強的學習行動來調控多巴胺神經的行為。這種自學習非常複雜,可以包括對外界以至別人對行動的可能反應(同情),還有把實際行動的結果與其他假設情況的對比(後悔)。所以這些我們所熟悉的情緒,都可能是學習過程的一部分。
這兩個決策系統都是或多或少在意識之外運作的。在它們的影響下,才有“基於”邏輯和理智的意識活動,根據周圍情況來選擇合適的行動方案。除此之外,有些與生俱來的感情也影響着決策。例如在人際關係中,信任,公平等常常得到超過理性的重視。而這些可能就是進化給我們的“偏見”禮物。影像實驗表明,在大腦中,有些特定的部位主管這些感情因素。同時,這些偏見甚至會影響我們的感知系統,“過濾”外界輸入的信息。
其實,以上說的這些不過是證實了長久以來人們對大腦決定過程的了解和猜測。然而現代神經科學通過功能核磁共振成像(fMRI)進一步確定了這些功能的具體部位,並了解到了更多的細節。雖然這對於了解大腦來說還只是管窺而已,但已經給我們了解自己的思想和行為提供了一些新的知識。
大腦的“目標設定”系統是在意識之外,影響着我們的決策過程。這個已經不是新聞了。但我們的意識還是有着反作用的。多巴胺神經系統的目標設定雖然由基因決定,但卻是可以改變的。例如,食物的出現會引起“獎賞”信號。假如每次食物出現之前都有燈光閃動,那長久以後燈光閃動就會引起“獎賞”信號,而食物卻不會了。也就是說,燈光“代替”了食物成為“基本目標”。而人的一些理念也能代替生存需求而成為主宰獎賞的“基本目標”。所謂“洗腦”,可能就是這個層次上起作用的。而人的一些心理疾病,根源也是在目標設定系統。 例如偏執的人,可能就是前額葉保持目標的能力太強,而使得目標不能及時被更新。
更有趣的是對於毒癮的認識:毒品會觸發多巴胺的釋放,帶來“獎賞”。通常,“獎賞”提示外界條件變好(更有利於生存)。這個提示是一次性的。除非條件又發生改變,“獎賞”就不會重複出現。但毒品不是這樣。每次使用,都會導致新的“獎賞”信號,從而影響自學習過程,使得“獲得毒品”這個目標在決策中的權重越來越大,也就使人在毒癮中越陷越深。因為這個過程是在意識以外的,所以說靠“意志”能戒毒,或相信自己有足夠“定力”不染上毒癮,都是不現實的。避免毒癮的唯一辦法是遠離毒品。
老年人常見的帕金森症,表面上看是運動系統失控的原因:病人手足顫抖,無法自主控制。但實際上病因是決策系統的問題:由於多巴胺的通路受阻,決策系統得不到“指導”而不能在眾多選擇中作出決定,而使得肢體行動限於癱瘓。【傳統上已知 帕金森症與多巴胺有關,但認為是多巴胺缺陷直接影響運動中樞。這裡的新說法不知有沒有得到實驗觀察證實。】
對人腦了解的進展,也使得我們再次審視一個基本的哲學問題:人有自由意志嗎?現在的回答應該是:有,但不完全。我們已經看到,人的決策從根本上是受着進化所產生的,有利於生存的“基本目標”所左右的。而人為的理念,通過一些途徑也能取得“基本目標”的地位(有時我們稱這種超出理性的“超級理念”為“信仰”或“狂熱”)。所以我們的意志(決策能力)並不是完全“自由”的。另一方面,目標和獎賞並不代替決策。我們的理性,價值觀,智慧,經驗,還是能在目標和獎賞的影響下做出自己的決定。所以一般來說,我們還是需要為自己的行為負責。而且對於那些支配決策過程的“超級理念”,我們也不是絕對無法控制的。例如,理念這類目標會在自我學習過程中逐漸淡化,讓位於生存所需的基本目標。所以我們常說“時間是良藥”,許多非理性的偏執和情結會隨着時間流逝而自然消失,我們只要不去加強它就行了。有一本書《注意力》就講到用控制注意力來影響世界觀,人際關係和思維模式的很多研究成果【注二】。所以,我們的腦子是可以駕馭的,只要我們了解了它的內在規律。
雖然《為什麼選擇本書?》得到了很多好評,但是我認為這本書還是有很多不足。從學術上說,最要命的是它沒有清楚地區分已有的知識,要介紹的新研究和作者的推測。在這一點上,作者與其他人合作的一篇論文【注三】提供了更系統嚴格的介紹,特別是列出了很多未知答案的問題。從行文上說,本書結構比較渙散,作者在每章的引言和舉例中花費太多筆墨而沒有有效地引出主題。有人說應該把篇幅砍掉一半,我也深有同感。作者對談論到的一些基本概念也沒有定義清楚,甚至在不同的章節段落中似乎對同一個概念採用了不同的內涵。文字也比較拗口,常常一句話要讀兩遍以上才明白其語法結構和意思。這是作者的第一本書,所以也許編輯的責任更大些。我覺得讀這本書不是一個享受,但是它可以作為進一步的搜尋和思考的起點。
這本書介紹的神經科學知識,對於我們了解大腦,了解自己很有意義。但作者的目的之一是要說我們的腦子是一個近乎完美的計算機。由於它的目標獎賞結構,它能比數字計算機遠為高效地完成決策任務。然而我的感覺是:作者對於計算機科學並不十分了解。在我看來,大腦的目標,偏見,分層決策,自學習等功能,應該是現代計算機算法中已經採用的。也許具體算法上還有許多需要研究的地方(如自學習),但這方面計算機要模仿人腦的話,應該沒有什麼本質上的困難。
但是人腦和計算機的區別還不僅於此。比如,人的思考有一定的隨機性。兩個人之間兩次下棋,會有不同的棋局。而兩個計算機之間下棋,我猜想結果會是重複的。這種隨機性不僅帶來博弈上的優勢(對手不能預測我的行為),更可能是人的創造力的基礎(比如在不同概念之間找到新的聯繫)。所以,計算機要趕上人腦,不光是速度和內存或算法的問題,而是至少還需要幾次革命才行。
注一:John P O’Doherty, Nature Neuroscience, Vol. 10, No. 10, page 1225 (2007), Andy Clark, Nature, Vol. 445, No. 15, page 711 (2007)
注二:“Rapt: Attention and the Focused Life”by Winfred Gallagher, Penguin Press, 2009
注三:A. Rangel, C. Camerer and P. R. Montague, Nature Reviews Neuroscience, vol. 9, page 545 (2008)
|
|