中國網絡審查制度如何允許批評政府卻禁止群體煽動（三）-老手多言-万维博客-万维读者网（电脑版）

设万维读者为首页

万维读者网 -- 全球华人的精神家园

广告服务

联系我们

关于万维

首　页

新　闻

视　频

博　客

论　坛

分类广告

购　物




老手多言的博客
已过半百，阅人无数，事态炎凉，皆抛脑后，偶发随感，大多废话
		https://blog.creaders.net/u/7992/ > 复制 > 收藏本页

网络日志正文

		中國網絡審查制度如何允許批評政府卻禁止群體煽動（三）	2013-11-09 07:02:35

http://chaoglobal.wordpress.com/2013/10/24/china-net/

結論概述

上述兩個假說可能都對，也可能一對一錯或者全錯。根據我們的證據，答案很簡單：國家批評論是錯誤的，潛在群體行為論是正確的。我們的數據表明，中國的審查機制允許對中國政府、官員和政策的廣泛批評。結果是，審查首要針對的是限制可能引發群體行為的信息傳播，不論這種表達是直接反對政府還是與政策有
關，都會審查。如果網上發帖數量大增，且內容與可能引發群體行為（如地面抗議）的事件有關，那麼審查就會到來。此外，我們還考察了每個事件中的情緒，發現在這些事件中，政府對支持和批評的觀點一概刪除。這表明中國政府相信，壓制有可能引發群體行為的帖子比壓制批評對維持統治更加重要。

數據

我們收集大量具體信息時面臨巨大挑戰，中國政府不希望任何人看到這些信息，因此會竭盡全力阻止別人獲取。下面我們我們將討論審查的種類，數據收集過程，該研究的局限性，以及我們對數據做後續分析的方法。

審查的種類

中國審查社交媒體上人類表達至少有3種方式，最後一種使我們研究的重點。首先是“中國大防火牆”（長城），
該防火牆完全禁止某些網站在中國郀I。大防火牆令很多國外的互聯網公司頭痛，也阻止了中國人通過這些網站與國外的人交流。但中國人可以用其他的網站，用相似的方式表達自己的觀點，對此防火牆就無能為力了。比如，臉書在中國被禁，但人人網是相似的替代品；同樣新浪微博也是人氣很旺的推特的克隆網站。

第二種方式是“關鍵詞屏蔽”，它防止用戶發佈含有被禁的詞或短語的文本。這對限制言論自由作用有限，因為網民發現比自動程序聰明並不難。他們用類比，比喻，諷刺等方式逃避審查。漢語提供了多種新穎的方法，比如替換漢字，其意思與原意無關但讀音相似（同音字）或看上去相近（同形異義字）。比如目田，本意是“眼睛田野”，但被魔獸世界玩家用來代指自由。同音字方面，“hexie”這個音經常被寫成河蟹，意思是河里的螃蟹，但它是代指和諧，即官方的“和諧社會”政策。

一旦跨過了前兩個障礙，文章就在網上發佈了，審查者將閱讀並刪除那些不妥的文章。根據研究文獻、觀察家、與數個政府內部人士的談話以及對數據的審核，我們幾乎可以斷定，內容過濾很大程度上是人工完成的——審查者手動閱讀文章。自動程序似乎只是輔助。跟大防火牆和關鍵詞屏蔽不同，手動審查不會被文字遊戲糊弄。因此，這也是最後也是最費力的審查方式，也是本文的研究重點。

收集

我們先收集社交媒體上的博客，至少在審查到來前，作者可以完整的表達他們的思想。在很多國家，如美國，幾乎全部博客都集中在少數幾個大網站上（臉書、谷歌博客、Tumblr等）；中國確實有新浪這樣的大網站，但還有很大一部分社交媒體資源分佈在無數的單個站點上，比如地方bbs論壇等。這種多元對數據的收集工作造成了邏輯上的挑戰。由於網址、軟件界面、地方審查官員、網絡可靠性、訪問速度、使用條款各不相同，審查模式也不同，能對我們的數據收集造成潛在妨礙的方式也多種多樣。幸叩氖牵袊毺氐纳缃幻襟w結構也為研究各地對群體表達的監管提供了絕佳機會，因為大量的本地站點提供了豐富的信息，這比在美國還要便利。

數據收集面臨的最複雜的挑戰是，趕在中國政府閱讀並刪除不妥的內容之前，定位、訪問並下載相關內容。此外，對每個帖子進行頻繁重訪以確認刪除的時間。還要在中國很多地方收集數據同時不會影響到我們研究的審查機制，研究也不會遭到制止。

我們能完成的原因是數據手機系統高度自動化，而中國審查系統涉及人工操作。我們龐大的工程（由於明顯原因將不會在此詳述）在全世界很多地方咝校ㄖ袊鴥鹊亍�

最後，在2011年前半年，我們從1382個中國網站上定位、訪問並下載了社交媒體帖子。中國社交媒體結構最顯著的特就是它有極長的（冪律狀的）尾巴。圖1是各網站的樣本和中文標識（圖片a）以及代表該長尾的網帖數量餅狀圖（圖片b）。最大的網帖來源是新浪博客（占總數的59%），百度嗨，華生論壇，四月論壇和天涯。但尾巴還在一直延伸。

社交媒體帖子涵蓋的話題範圍太廣，以致于企圖涵蓋一切的隨機取樣策略很難對單一的話題提供有價值的信息。因此，我們採取了分層隨機抽樣設計的方法。我們先選取了85個單獨的話題範圍，並按照假定的政治敏感性分為高（如艾未未）、中（如計劃生育）、低（如流行網遊）三檔。通過回顧以前的研究、咨詢中國專家以及對當下事件進行研究，我們分別在這三檔中選取某些特定話題。附錄A是完整的清單。然後，對每個話題範圍（用關鍵詞區分），我們收集6個月時間內所有相關的社交媒體帖子。我們檢查每個話題範圍的帖子，刪除垃圾郵件，再用輔助閱讀工具對內容進行研究。（Crosas et al. 2012; Grimmer and King 2011）我們收集了3,674,698篇帖子，其中隨機選出127,283篇進行進一步分析。（我們在其他時間段里重複這一過程，有時候會對某些話題範
圍進行更深入的研究。總共收集並分析了11,382,221篇帖子。）所有這些來自中國站點的帖子都是用中文寫的，不包來自括香港和臺灣的文章。我們先閱讀每篇文章的內容，將其置於某個話題範圍的時間軸上，並重複訪問源網站以確定其是否被審查。根據需要，我們將用其他特定的數據對該信息進行補充。

審查者們並不害羞，因為我們發現可以直接區分（有意的）審查和零星的斷電或短暫的超時錯誤。被審查的網頁包含這樣的字眼：“抱歉，指定的主題不存在或已被刪除或正在審核”，有時候也會有警警和察察的標誌。

儘管我們的方法比審查者快，但他們顯然也是高度專業的。為了說明這一點，我們隨機收集並分析了2011年9月27日上海地鐵相撞事件前後的網帖、2012年4月10日到12日薄熙來事件的網帖和有關谷開來的網帖。

我們對上述三個話題範圍的帖子進行不間斷監控，一共監控了9天。（其他範圍的審查遵循同樣的基本方式）圖2表示的是被審查的帖子數的直方圖。在三個事件中，大多數的審查是發生在原文發佈後的24小時之內，當然也有一小部分帖子是5天之後再被刪除。這是一種驚人的組織能力，它需要大規模的軍隊般的精確：不同政府級別、分管不同互聯網內容提供商的領導需要首先做出決斷（通過一致意見、直接命令或折中），決定什麼內容需要被審查；他們需要將該決定傳達給數十萬的個人；然後他們在大約24小時之內完成審查工作。正如埃德蒙（2012）指出，社交媒體上信息源的激增讓信息越來越難以控制，然而，中國政府竟然
在全國範圍內克服了這一困難。鑒於很多人很難達成一致意見，而且文本解釋中實現高級別的編碼者信度通常會很困難（比如Hopkins and King 2010, Appendix B）政府對審查工作的努力是巨大而專業的。我們發現了一些證據，表明這一龐大蕪雜的官僚體制中存在不同意見，比如在不同級別的政府之間。但我們尚未對此進行細緻的研究。

局限性

如下所示，我們的方法很大程度上揭示了中國領導層的目標，但它缺少網站的自我審查以及在我們獲得內容之前進行的審查；它也沒有對大防火牆、關鍵詞屏蔽或搜索過濾的直接效果進行量化。我們也沒有研究肢體暴力的效果，如逮捕博主或進行威脅。儘管各級政府和官員會對審查什麼、何時審查進行干預，但我們的數據有時候並不能讓我們對這些信息源加以區分。

我們當然無法判斷這些局限性的後果，不過我們可以合理地推斷其中最重要的當屬肢體暴力、威脅以及由此導致的自我審查。儘管我們分析的社交媒體數據包
含數百萬中國人的意見且涵蓋了機器廣泛的話題和演講行為，而我們無法觀察的更少的討論活動很可能是對中國政府利益最要緊（或最緊迫的）。

最後，過去對互聯網行為的研究是基於他們的測量方式跟“現實世界”行為有多接近；接著，網絡行為佔據了人類生活很重要的位置，因此今天社交媒體上觀
察到的思想本身就非常重要，不論它能否很好地衡量非網絡自由和行為。但無論是哪種方式，我們難以拿出證據說明，我們對中國社交媒體的研究跟新聞自由或其他
的人類表達有什麼關聯。

分析策略

總體上看，大約有13%的帖子被審查。如果將所有領域所有的帖子匯總起來，這一平均水平隨著時間的推移變化不大，但它會隨著帖子數量和審查力度的變化產生巨大變化。我們發現，潛在政治敏感性和審查之間的關聯性非常低：在低檔和中檔敏感度事件中，審查率基本一致（分別是16%和17%），僅僅比高檔敏感度事件（24%）低了一點。顯然還有一些事情。為了發現是什麼事，我們接下來討論我們的編碼規則、核心假設和中國政府可能的審查程序。

編碼規則

我們分5步進行編碼。

首先，我們先將社交媒體帖子按分層隨即抽樣設置的關鍵詞，將其分為85個話題範圍。儘管我們做了大量的檢查（通過大量閱讀並借助現代電腦輔助閱讀技術），確保其準確性，我們的話題範圍里難免（借助任何機器或人工分類技術）存在一些歸類錯誤的帖子。我們採用了保守的方法，先做出結論，忽略這一錯誤的影響。隨後，我們進行了反復的篩查（用同樣的技術），確保我們不會錯過任何重要的信息。這種歸類錯誤可以看做是系統性錯誤，但其中的每個事件都鞏固了我們的結論。

第二，眾所周知，幾乎所有話題範圍（和國家）的言論是“陣發”的，即穩定的時期常常被偶然爆發的有關某話題的數量激增打破。我們還發現僅僅有兩個例外——色情內容和對審查者的批評，如下所述——審查工作在數量爆發（volume burst）時期（即事件熱點時期）力度往往格外大。因此，我們對數量爆發期前後的數據進行了處理。我們將每個話題範圍都看做6個月時間序列中每天的數量，並採用文件回歸技術計算的權數偵測數量爆發，以確定在剩餘時間序列中的離群值（outlaying observations）。

通過這一過程，我們檢測到85個話題範圍中有67個出現數量爆發，一共出現了87次。

第三，我們將每個事件歸為一下五類：

潛在群體性事件，
對審查者批評，
色情內容，
政府政策，
其他新聞。

每個類別都可能包含批評或不批評政府、領導人和政策的帖子。我們將群體行為定義為：兩個（含）以上的人，受到參與者而非政府官員或政府代表的鼓動或控制，追求目標的行為。我們的“潛在群體行為”理論上包括任何有可能引發群體行為的事件，但是為了保守起見，並確保編碼規則清楚明確且可以重複，我們將這一範疇限制在

a）包含抗議活動或有組織的人群組成；
b）與曾經組織或引發群體行為的個人有關；
c）與曾經引發抗議或群體行為的民族主義或民族主義情緒有關。

事件是指，對效命於政府或非政府實體的審查者的批判，包括個人和公司。色情是指，包含色情或明顯性方面內容的電影、網站或媒體的廣告或新聞。政策指政府聲明或政府活動報告，包括國內或對外政策。其他新聞是指對上述4類事件以外的事件的報告。

最後，我們進行了一項研究以驗證我們編碼規則的可靠性。為此我們把上述規則給兩位熟悉中國政策的人看，並請求他們對87個話題範圍分別進行編碼（每個話題範圍都與一個數量爆發有關），並將其歸入上述的5個範疇中。編碼者獨立工作，獨自對這些事件進行歸類。兩位編碼者的一致率是98.9%，即87個話題中的86個歸類都相同。唯一不同的話題是方濱興（大防火牆的發明者）遭扔鞋事件。這一事件中，既有對審查者的批評，在一定程度上也是群體行為，因為有好幾個人一起向方濱興扔鞋。我們將該事件作為批評審查者的例子，不過不管它怎麼編碼，都不會影響我們的結果。因為我們估計兩個都會遭到審查。

浏览(537)

(0)

发表评论

我的名片

老手多言

注册日期: 2013-10-17
访问总量: 85,237 次

点击查看我的个人资料

Calendar