科研工作者在做一項新的研究之前,需要查閱大量的雜誌文章。他們要搞清楚前人在這個課題上做了哪些工作,有了哪些結果。在以前沒有計算機的年代,只能到圖書館去查閱,非常原始,一本一本地搜索,費時費力,而且還不容易查全。
有一家美國公司,名叫 Thomson Reuters,利用計算機的技術,把一些主要雜誌中的全部文章的標題,作者,引用文獻的目錄,摘要和關鍵詞,扒拉扒拉。。。,輸入到它的數據庫中。這樣,科研工作者就很容易在數據庫中輸入一些關鍵詞,立刻找到他所需要的文獻。尤其方便的是,只要找到一篇相關的文章,根據這篇文章所引用的別人的文章和別人引用他的文章,你就可以知道這文章之前和之後的相關的工作。這種順藤摸瓜的辦法,可以讓你很快地查到有關某個課題的比較全面的研究狀況。
舉一例:我打進了一個詞“黎曼”,就有一大串有關“黎曼”的文獻。我選了其中一篇文獻,屏幕上會出現各種數據。其中幾個很重要的數據是:這篇文獻被人家引用的次數,反之,它又引用了別人文獻的次數。順着這些點擊出來的信息,再點擊進去,又可以看到被引用過的文獻的歷史。可以說,整個課題的研究狀況一目了然,清清楚楚的。
在文獻進入數據庫時,所有的相關信息同時被更新。這麼多的便利,使得這家公司的產品受到科研工作者的很大的歡迎。
然而,公司的人力物力是有限的,無論如何也不可能把全世界的雜誌全部收錄進數據庫,那麼,它就需要一種判斷雜誌的好壞來決定取捨的標準。這個數據庫里,有兩個最重要的東西:“引”和“被引”的次數。這公司用了一個很簡單的公式來衡量一本雜誌的好壞,這裡引進一個詞,叫“影響因子”:假設一本雜誌在2013年和2014年,一共發表了200篇文章,而且這200篇文章在2015年一共被引用了300次,300/200 = 1.5,這本雜誌在2015年的“影響因子”是 1.5,就這麼簡單。 不難猜出,“影響因子”高的雜誌是比較好的雜誌,至少這個公司就是這麼認為的,這是它的初衷。假設,某個專業有5000種雜誌,這個公司要挑選500種雜誌收錄進它的數據庫,它就按照“影響因子”的高低來排隊,最高的前500名就會被選入數據庫。進一步還會細分,以“影響因子”的高低,分出一流,二流,三流的雜誌,這裡不詳細介紹了。 到此為止,所謂的“影響因子”僅僅是這家公司取捨雜誌的一種標準,並沒有用來衡量科研工作的好壞。 上世紀,國內的學術界不大規範, 爛文章大量發表在學校的刊物上,晉升職稱要走後門。中國南京大學針對這些問題,為了要對科研工作的評價更加客觀化,使用了這家公司的錄用雜誌列表 (SCI, Science Citation Index) 來作為評判科研文章的標準。如果一位科研人員在 SCI列表包含的雜誌上發表了一篇文章,就能得到一定的獎勵,以後的晉升職稱也都和SCI掛上鈎。這個辦法當然好。首先,要在SCI雜誌上發表文章就不容易,能發表在上面的,質量一般都不錯,因為這是國際雜誌,你沒辦法走後門。後來中國很多大學和科研單位,也採用了南京大學的這種辦法。這種新的評估標準,起到了一定的積極作用,在當時,確實提高了中國的整體科研水平。 接着,亞洲的其他地區,甚至歐美的一些學校,也開始採用SCI收錄和引用數據作為科研成果的評判標準。 本來是件好事情,排排隊分果果也有個公平的標準。但是,世界上總有那麼一些心術不正的人,想搞些歪門邪道來增加自己的名利。而這個SCI, 偏偏是防君子不防小人的東東。上面已經介紹了,“影響因子”的公式是非常簡單的。這裡有兩個地方會被人盯上,並做手腳的: 1. 增加個人的引用次數 2. 增加某本雜誌的“影響因子” 達到以上兩個目的,最原始的辦法就是作者自己引用自己以前的文章,這叫做“自引”。適度的自引是完全合理的,畢竟,一個作者的後續工作和他前面的工作,往往都是有聯繫的。還有一種情況就是雜誌的自引,也就是說,這本雜誌的一篇文章引用同一本雜誌以前發表的文章。適度的雜誌自引,也是完全合理的。SCI的數據庫會把作者的自引和雜誌的自引單獨統計出來,自引的指數超過紅線,SCI很可能會把它們踢出去。可以看出,通過增加自引達到上述的兩個目的是不太容易做到的。 有一種比較隱蔽的操作很難防止,請看2009年震驚數學界的一起醜聞:有一本中國的數學雜誌,聯合其他的幾本雜誌,結成同盟。一本雜誌的文章大量引用同盟軍中的其他雜誌的文章。這幾個雜誌的主編,利令智昏,貪得無厭,結果使得這個同盟軍中的所有雜誌的“影響因子”遙遙領先地虛高。這些名不見經傳的雜誌,怎麼會這樣耀眼,比世界頂級雜誌還要領先呢?這個現象引起了美國應用數學學會主席,Douglas Arnold 的注意。他做了深入的調查,揭穿了這個陰謀。他為此醜聞專門寫了篇文章,發表在 2009年 SIAM News上面。文章中指出:只要有人蓄意想做這件事,那麼我們通過改變公式,或者改變統計方法,都是難以防止的。這種操作方法,既不能算作弊,也不能算犯法。唯一的防止辦法是,不要把“影響因子”和引用次數作為評判科研成果的好壞和雜誌的優劣的標準,至少不要作為唯一的標準。 怎麼辦?回歸到最原始的初衷,是最理想的。但很難做到,原因有以下幾個: 1. 產量高的,引用率高的作者,很願意看到這些數據,因為這對他們來講是一種榮譽,一 種肯定。 2. 只要沒被動手腳,引用率高的作者,水平也通常比較高。Thomson Reuters 用引用數據來預測諾貝爾獎得主,據說還蠻準的。 3. 行政管理人員很喜歡。因為使用數據簡便宜行,再笨的人,數字總能看得懂的,這比組織同行評估要方便得多了。 以上討論,主要以數學領域為例。其他的科學領域也有相關的“影響因子”,但它們互相之間,蘋果對香蕉,沒有可比性。舉一例:1.5 的“影響因子”在數學界裡,算是相當好的雜誌了,但在生物界恐怕是垃圾雜誌。原因是,數學的文章寫起來很慢,發表周期也很長。所以數學文章的被引用大多是在發表兩年之後發生的,因此也就對雜誌的“影響因子”沒有貢獻。但是生物界的科研成果更新很快,很大一部分引用都是在兩年之內發生的,也就都進入了“影響因子” 的計算中。這也是用同一個定量的指標來衡量不同領域雜誌的缺陷。很不幸,這個缺陷恐怕很難避免。
|