科研工作者在做一项新的研究之前,需要查阅大量的杂志文章。他们要搞清楚前人在这个课题上做了哪些工作,有了哪些结果。在以前没有计算机的年代,只能到图书馆去查阅,非常原始,一本一本地搜索,费时费力,而且还不容易查全。
有一家美国公司,名叫 Thomson Reuters,利用计算机的技术,把一些主要杂志中的全部文章的标题,作者,引用文献的目录,摘要和关键词,扒拉扒拉。。。,输入到它的数据库中。这样,科研工作者就很容易在数据库中输入一些关键词,立刻找到他所需要的文献。尤其方便的是,只要找到一篇相关的文章,根据这篇文章所引用的别人的文章和别人引用他的文章,你就可以知道这文章之前和之后的相关的工作。这种顺藤摸瓜的办法,可以让你很快地查到有关某个课题的比较全面的研究状况。
举一例:我打进了一个词“黎曼”,就有一大串有关“黎曼”的文献。我选了其中一篇文献,屏幕上会出现各种数据。其中几个很重要的数据是:这篇文献被人家引用的次数,反之,它又引用了别人文献的次数。顺着这些点击出来的信息,再点击进去,又可以看到被引用过的文献的历史。可以说,整个课题的研究状况一目了然,清清楚楚的。
在文献进入数据库时,所有的相关信息同时被更新。这么多的便利,使得这家公司的产品受到科研工作者的很大的欢迎。
然而,公司的人力物力是有限的,无论如何也不可能把全世界的杂志全部收录进数据库,那么,它就需要一种判断杂志的好坏来决定取舍的标准。这个数据库里,有两个最重要的东西:“引”和“被引”的次数。这公司用了一个很简单的公式来衡量一本杂志的好坏,这里引进一个词,叫“影响因子”:假设一本杂志在2013年和2014年,一共发表了200篇文章,而且这200篇文章在2015年一共被引用了300次,300/200 = 1.5,这本杂志在2015年的“影响因子”是 1.5,就这么简单。 不难猜出,“影响因子”高的杂志是比较好的杂志,至少这个公司就是这么认为的,这是它的初衷。假设,某个专业有5000种杂志,这个公司要挑选500种杂志收录进它的数据库,它就按照“影响因子”的高低来排队,最高的前500名就会被选入数据库。进一步还会细分,以“影响因子”的高低,分出一流,二流,三流的杂志,这里不详细介绍了。 到此为止,所谓的“影响因子”仅仅是这家公司取舍杂志的一种标准,并没有用来衡量科研工作的好坏。 上世纪,国内的学术界不大规范, 烂文章大量发表在学校的刊物上,晋升职称要走后门。中国南京大学针对这些问题,为了要对科研工作的评价更加客观化,使用了这家公司的录用杂志列表 (SCI, Science Citation Index) 来作为评判科研文章的标准。如果一位科研人员在 SCI列表包含的杂志上发表了一篇文章,就能得到一定的奖励,以后的晋升职称也都和SCI挂上钩。这个办法当然好。首先,要在SCI杂志上发表文章就不容易,能发表在上面的,质量一般都不错,因为这是国际杂志,你没办法走后门。后来中国很多大学和科研单位,也采用了南京大学的这种办法。这种新的评估标准,起到了一定的积极作用,在当时,确实提高了中国的整体科研水平。 接着,亚洲的其他地区,甚至欧美的一些学校,也开始采用SCI收录和引用数据作为科研成果的评判标准。 本来是件好事情,排排队分果果也有个公平的标准。但是,世界上总有那么一些心术不正的人,想搞些歪门邪道来增加自己的名利。而这个SCI, 偏偏是防君子不防小人的东东。上面已经介绍了,“影响因子”的公式是非常简单的。这里有两个地方会被人盯上,并做手脚的: 1. 增加个人的引用次数 2. 增加某本杂志的“影响因子” 达到以上两个目的,最原始的办法就是作者自己引用自己以前的文章,这叫做“自引”。适度的自引是完全合理的,毕竟,一个作者的后续工作和他前面的工作,往往都是有联系的。还有一种情况就是杂志的自引,也就是说,这本杂志的一篇文章引用同一本杂志以前发表的文章。适度的杂志自引,也是完全合理的。SCI的数据库会把作者的自引和杂志的自引单独统计出来,自引的指数超过红线,SCI很可能会把它们踢出去。可以看出,通过增加自引达到上述的两个目的是不太容易做到的。 有一种比较隐蔽的操作很难防止,请看2009年震惊数学界的一起丑闻:有一本中国的数学杂志,联合其他的几本杂志,结成同盟。一本杂志的文章大量引用同盟军中的其他杂志的文章。这几个杂志的主编,利令智昏,贪得无厌,结果使得这个同盟军中的所有杂志的“影响因子”遥遥领先地虚高。这些名不见经传的杂志,怎么会这样耀眼,比世界顶级杂志还要领先呢?这个现象引起了美国应用数学学会主席,Douglas Arnold 的注意。他做了深入的调查,揭穿了这个阴谋。他为此丑闻专门写了篇文章,发表在 2009年 SIAM News上面。文章中指出:只要有人蓄意想做这件事,那么我们通过改变公式,或者改变统计方法,都是难以防止的。这种操作方法,既不能算作弊,也不能算犯法。唯一的防止办法是,不要把“影响因子”和引用次数作为评判科研成果的好坏和杂志的优劣的标准,至少不要作为唯一的标准。 怎么办?回归到最原始的初衷,是最理想的。但很难做到,原因有以下几个: 1. 产量高的,引用率高的作者,很愿意看到这些数据,因为这对他们来讲是一种荣誉,一 种肯定。 2. 只要没被动手脚,引用率高的作者,水平也通常比较高。Thomson Reuters 用引用数据来预测诺贝尔奖得主,据说还蛮准的。 3. 行政管理人员很喜欢。因为使用数据简便宜行,再笨的人,数字总能看得懂的,这比组织同行评估要方便得多了。 以上讨论,主要以数学领域为例。其他的科学领域也有相关的“影响因子”,但它们互相之间,苹果对香蕉,没有可比性。举一例:1.5 的“影响因子”在数学界里,算是相当好的杂志了,但在生物界恐怕是垃圾杂志。原因是,数学的文章写起来很慢,发表周期也很长。所以数学文章的被引用大多是在发表两年之后发生的,因此也就对杂志的“影响因子”没有贡献。但是生物界的科研成果更新很快,很大一部分引用都是在两年之内发生的,也就都进入了“影响因子” 的计算中。这也是用同一个定量的指标来衡量不同领域杂志的缺陷。很不幸,这个缺陷恐怕很难避免。
|