提到網絡,我們自然就想起互聯網。但實際上,互聯網只是我們生活中許多網絡之一。有個笑話說,外星人用強大的望遠鏡研究地球,得出的結論是:“在地球大陸上有個巨大的網,上面生活着許多長着輪子,整天跑來跑去的動物。這些動物體內有一種兩條腿的寄生蟲。”其實,公路網是最容易看見的,其他還有電網,電話網,數據網等等。這些是有形的。還有無形的人際關係網,物流網等等。這些形形色色的網絡各不相同,但卻有着許多驚人的共性。 抽象地說,一個網絡的組成就是一組節點,其中一些節點之間存在着連接。最簡單的網絡模型,就是每兩個節點都有同樣的幾率建立連接。就這麼個簡單的模型,就有不少有趣的性質。例如,建立連接的幾率有個“閾值”,相當於每個節點平均有兩條連接。如果幾率超過這個閾值,那麼網絡的各個節點就會連在一起,否則它們就會形成互不相連的片段。【注一】這個網絡結構的“突然”變化,就像水在零度時變成冰的“相變”一樣。另一個出乎意料但數學上很容易理解的結論,是任何兩個節點之間的平均距離(需要跨過的連接數)都不會很大。節點的平均連接數越大,這個距離就越短。著名的“六度分隔”(世界上每兩個人之間通過六個“中間人”就能拉上關係),就是一個例子。 這個隨機網絡模型雖然簡單有趣,卻和現實相差甚遠。就拿“六度分隔”來說吧,我們都知道人和人的距離並不是一樣,而是與社會的結構有關。舉個例子吧。美國常春藤學校每年招生數目加起來大概是一萬人。美國在阿富汗的駐軍大概是十萬人。在我們美國華人中,有幾個有朋友的孩子今年進了常春藤學校?有幾個有朋友在阿富汗打仗?然而,我們也不是生活在完全彼此隔離的世界中。比如我就有個只見過一面的華人朋友,他的兒子是西點培養的未來軍官。人際網通常是一個個“圈子”組成的,而圈子之間又有着少數“長途”的聯繫。其實,這樣結構的網絡還有很多。如道路網就是以一個個城市組成的“圈子”,之間由高速公路相連。在網絡理論中,這樣的“圈子”就叫做簇(cluster)。 有了簇的結構,節點之間就不是平等的了。有些節點的連接特別多,因為它們同時參與多個簇。因此,他們也是簇之間的“橋梁”,稱之為樞紐(hub)。例如大城市常常是好幾條高速公路的交匯點,就是一個樞紐。這種網絡有個特點,就是它的穩定性。如果隨機地去掉一些節點,網絡不會因此而斷開,因為大多數節點都屬於某一個簇,而簇內的節點之間有很多連接通道。但是如果你有選擇性地破壞的話,去掉一些樞紐就會使整個網絡解體。互聯網就是這樣的網絡。所以對於隨機的設備損壞來說,互聯網是很穩定的。但是對於惡意的攻擊,它又是很脆弱的。人的交際網也是這樣。所以要防止人之間疾病的傳播,如果從少數起樞紐作用的“關係大戶”着手,就會比平均治療有效得多。 這種“不平等”網絡中有很重要的一類,叫做“冪律”(Power Law)。如果我們把這種網絡中的節點按其連接數目來歸類的話,就會發現連接越多的節點數目越少,但總有連接非常多的個別節點。事實上,每一類節點的數目與對應的連接數的某個冪(比如負二次方)成正比,所以叫冪律。這種網絡又被稱為“無標度”(scale-free)。其中的含義這裡就不討論了。在冪律網絡【注二】中不僅有樞紐,而且樞紐還有級別。有極少數連接非常多的“超級樞紐”,其他較多的普通樞紐連接數就沒那麼多。而絕大多數的節點只有很少的連接數。 節點和連接的冪律分布最早是在科學論文相互引用的關係中發現的。後來研究網站的相互鏈接時也發現了同樣的現象,從而引起人們的注意。從那以後,人們發現世界上的很多網絡都是冪律的。究其原因,這種特性與網絡的生成過程有關。在網絡成長的過程中,如果每個節點被新加入的節點所連接的幾率它已有的連接數目成正比,那結果就形成了冪律的網絡。我們很容易想象論文引用與網站鏈接在定性層次上都有這樣的特性:名氣越大的作者和網站越容易吸引新的注意力。這種“富者愈富”的現象在大多數人為的網絡上都能見到。即使自然形成的網絡也有這樣的冪律。例如細胞內各種蛋白質之間相互產生化學反應,也可以看成是一個網絡。這個網絡也有冪律分布。這當然不是因為蛋白質也會“趨炎附勢”,而是進化的結果。在進化過程中,一個蛋白質會分化成幾個相似結構的蛋白質。而它們都與原來相連接 的對象保持連接。也可以說,每個節點的連接會成比例地增加,從而形成冪律網絡。 冪律網絡的研究把動態分析引入了網絡理論。但是它只考慮了網絡的生成,即節點取得連接的過程。如果節點不僅能得到連接,還能失去連接,情況會怎樣呢?非常出人意外的是,這時的網絡在數學上與一種量子物理系統完全一樣! 考慮一個物理體系,有很多相同的粒子和很多能級。每個粒子都可能存在於某個能級上。按照經典的統計物理,粒子的能量分布是“玻爾茲曼分布”:大多數粒子呆在能量較低的能級,但也有少數會有較高的能量。只有到了絕對零度(物理上不可能實現的理想狀況),才會出現所有粒子都呆在最低的能級的情況。但是在量子力學中情況卻不同。在某些條件下,在極低(但不是零)的溫度下,會出現所有粒子都處在最低能級的情況,稱為玻色-愛因斯坦凝聚。1995年,這種已經提出了70年的相變現象終於得到了實驗證實。 在網絡中,我們可以把節點看成能級,把連接看成粒子。節點對連接有不同的“吸引力”,相當於上述多粒子體系中能級的能量。“吸引力”在節點中的差別程度,就相當於多粒子體系的溫度。節點不停地取得和失去連接,相當於連接在不同的節點之間“遊走”,網絡的結構達到動態平衡。與玻色-愛因斯坦凝聚理論同樣的數學推導預言,這樣的網絡也有“凝聚”的現象,也就是當節點間“吸引力”的差別很大(相當於溫度很低)時,一個吸引力最大(相當於能量最低)的節點會吸引所有的連接。這時網絡就形成“星狀”結構:所有節點都連向一個中心。這就不是“富者愈富”,而是贏者通吃了。當然,現實生活中這種情況很少。即使在高度壟斷的微機操作系統市場,微軟也還是有些競爭者。然而,這種數學分析對於我們理解一些現象來說是一個很有用的工具。 從上面的討論可以看出,當我們從最簡單的網絡模型(隨機網絡)出發逐步引入其他機制時,每一步都遇到了意想不到的發現。而這還僅僅是開始。例如,我們可以考慮單向的連接,有不同“強度”的連接,或時斷時續的連接。這個理論還會變得更豐富,更有趣。 網絡理論不僅是一個引人入勝的研究領域,而且有着重大的應用價值。例如,傳統經濟理論的中心是市場。每個參與者都是與“市場”打交道,試圖獲取最大利潤。但實際上,經濟活動並不是這樣簡單的“一對全體”的關係。公司和個人之間會形成各種合作和競爭的關係,他們的行為會因相互關係的不同而不同。公司的董事會之間有很多交叉任命,形成管理層內部的關係網,對於這些公司影響政策和市場的能力都有重大影響。投資銀行之間的交易和資金拆借也構成一個錯綜複雜的網絡。由於這個網絡的結構,一個銀行遇到困難時就可能影響到整個體系的運作。近年發生的金融危機就是一例。另一個例子是:恐怖組織的內部和相互之間也是網絡的連接。我們要順着網絡追蹤甚至預測他們的活動,或最有效地干擾他們的運作,也需要了解這個網絡的結構和相關性質。這個問題是反恐努力中的一個重要課題。在生物學上,除了前面說到的細胞內蛋白質的網絡外,體內的激素調控,以至於生態內的食物鏈,都是網絡。所以,可以說對於網絡的認識給許多學科帶來了新的範式(Paradigm)。 以上談到的網絡都是自發形成的,連接和節點按照一定的統計規律行動,沒有一個“總設計師”。即使完全是人造的網絡如電網或互聯網,也是在沒有集中控制的情況下長時間演化而成的,以至於今天人們還為了編繪這些網絡的“地圖”而努力。比起完全由人設計的網絡,這種自然形成的網絡是否有其優越性,就像生物進化的結果那樣?我們是否可以在網絡演化的某個階段加以影響,使得最後結果更符合我們的需要?比如,是否能通過立法或政府對某些金融機構的扶持來改變金融界的交易和拆借網絡結構,使得金融危機不容易發生?這些也是有趣的課題。 還有一個值得我們深思的網絡,就是人類的知識。知識是由很多概念組成的,這些概念之間通過經驗或邏輯聯繫在一起,形成一個網絡。目前,我們習慣於把知識分成學科,學科里又有分支,每個分支有基礎課,專業課等等,每門課又有第一章,第二章。。。這樣,至少從學校出來的人,他們的知識結構基本是線性的,缺少學科之間,分支之間的交叉聯繫。如果從網絡的角度看知識,我們會發現有些概念起着“樞紐”的作用,把不同的學科(類似於網絡中的“簇”)聯繫起來。這樣說來,學科之間,以至於科學,哲學,藝術,宗教之間,其實都是相互連接的。讓自己的知識結構從“線”變成“網”,對於鞏固,擴展和應用這些知識都有好處。另一方面,如果自然形成的網絡有其優越性的話,也許我們應該給學生以更多的自由,讓他們通過基於自己興趣和經驗的追求而自然形成自己獨特的知識網,而不是“生產”知識結構雷同的“線性人”。(見我的另一篇博文: 育兒漫談:“高指標人”和“多情趣人” ) 在這個知識網中,“網絡”這個概念本身就是一個重要的樞紐了。從以上的討論中我們可以看到,網絡的概念可以用到很多學科中去。這對與研究者個人也是如此。例如對冪律網絡的早期研究作出重大貢獻的科學家Albert-Laszlo Barabasi,原來是個物理學家。他在上世紀末開始研究網絡,在過去十幾年中參與了生物,通信,社會學等很多領域的工作。他還在2003年出版了一本暢銷書Linked。本文的大多數內容就是基於這本書的。這本書中通過許多名人軼事和作者自己的經歷來介紹網絡的基本概念,很是引人入勝。在我看來,這本書也是“網絡型“知識結構的一個很好例子。 和網絡密切相關的另一個概念是“複雜性(complexity)”。複雜性的研究對象是 “複雜系統”,也就是具有很多組成部分,但有一定結構而不是完全隨機的系統。關於複雜系統的研究已經有幾十年歷史了,也有了很多理論如自組織,混沌,臨界現象等。冪律和無標度也是複雜性理論中常用的概念。但是目前來看,複雜性研究中很多基本問題還沒有得到解決,也可以說是還沒有建立行之有效的範式。網絡可能是很多複雜系統的一個抽象,可能為複雜性理論提供了一個新的有力工具。 本世紀以來,網絡研究發展很快,也取得了很多重要成果。其中的重要原因是現代信息技術和計算技術的發展,使得大規模收集和處理數據成為可能。例如可以從手機通話的記錄中分析人和人之間關係的存在和密切程度。我們通過各種衛生組織可以非常細緻地追蹤疾病的傳播。這些瀚如煙海的數據自然引發了網絡研究的“淘金熱”。但是在我看來,網絡研究與複雜性研究一樣,面臨一個基本的困難,就是沒有合適的數學工具。我們大多數科學領域採用的都是“還原法”的研究手段,也就是把一個大系統分解為一個個更為簡單的子系統,最終到一些局域化(localized)的單元。我們常用的數學如微分方程等,也是針對這樣的局域化的研究對象的。另一個途徑是對於整體的統計方法,如統計力學,只考慮一些平均值而完全不管微觀的結構。但是對於不可分割而有結構的系統,就沒有好的數學手段了。就拿模式識別來說吧。我們人腦可以輕易認出畢加索筆下高度變形的人臉,或莫扎特12個變奏曲中的“一閃一閃小星星”主旋律。但是要設計一個計算機算法來做到這些,就沒有好的系統的方法。現在,網上還用識別簡單變形的數字和字母作為區別人和計算機的“測驗”呢。網絡理論的對象也是不可分割的系統而且具有相當豐富的結構。雖然已經應用了圖論等數學工具,但看來還是不夠。所以網絡同時也造成了對新的數學工具以致數學範式的需求。 網絡是個既古老又神奇的概念。它是生命的基礎,也是生命間共存的方式。今天,通信網絡改變了我們的生活方式,物流,金融和人際網絡也是我們不可或缺的基礎設施。對於網絡的研究和認識不僅幫助我們更好地認識很多事務,也會給我們一個觀察世界的新角度。在未來十年中,我們一定會有很多令人振奮的發現。 參考讀物: Albert-Laszlo Barabasi, “Linked”, Plume, 2003 Mark Newman, “The Physics of Networks”, Physics Today, November 2008, pp. 33 Marta C. Gonzalez and Albert-Laslo Barabasi, “From Data to Models”, Nature Physics vol. 3, April 2007, pp 224 Multiple papers, Science, vol. 325 Issue 5939 (July 2009) 【注一】 嚴格地說:如果連接幾率超過閾值,那麼當網絡很大(節點數很多)時,一定(幾率為一)有一定比例的節點是連在一起,形成一個“超級簇”。否則,每個簇中連在一起的節點數目是有限的,不隨節點數的增多而增大,也就是形成很多片段。要真正使所有節點都連在一起,那麼每個節點的平均連接數就需要隨着節點數的對數而增長。參照:http://econ-www.mit.edu/files/4622 【注二】 在文獻上這種網絡多被稱為“無標度網絡”。但鑑於“無標度”的意義在這裡沒有被涉及,本文仍稱之為“冪律網絡”。
文章評論
作者:歐陽峰
留言時間:2010-04-30 19:08:34
谷語草鳴:據說細胞中的網絡是基因研究的下一步,可以幫助認識各個基因在生命活動中的作用。不過我是外行,不知道裡面的細節。
作者:谷語草鳴
留言時間:2010-04-30 19:04:52
作者:歐陽峰
留言時間:2010-04-30 15:47:20
怡然:見到你真高興!模糊數學用在很多領域,其中一個重要的是模式識別。模式識別在網絡研究中也是一個工具。模糊數學應該是人工智能的一部分,而關於整個人工智能,特別是模糊數學的前景,似乎有不少爭論。主要原因是搞了那麼多年了,離原先的目標還差得很遠。這方面我是外行,就不敢多說了。
作者:歐陽峰
留言時間:2010-04-30 15:42:13
Beaubien2010: 的確,人脈非常重要,而且象我說的網絡那樣“富者愈富”。從你的博客就可以看出你這方面非常有天分。祝你生意成功,早日把人脈轉化成錢脈!
作者:怡然
留言時間:2010-04-30 06:22:35
歐陽: 你這篇文章本身就給我們提供了一幅上下縱橫的“網絡”科學圖解,很長見識。從互聯網到社會關係網,從物理學到生物遺傳學,錯綜複雜,互相聯繫又互相制約。以前也讀過一些文章,介紹模糊數學在道路交通網絡中的應用,以及模糊數學在網絡安全性評判上的應用。但不知道你文章結尾提到的建立數學模型,是不是就是指的模糊數學?這可能是個外行的問題呵。
歐陽兄 你的這篇論文,小女子我只讀懂了一半。但曾有一高人給我說過一句話,至今銘記在心:人脈則是錢脈。當然這句話有些俗氣,但也無不透露了social networking 在人們日常生活的重要性。