|

楼主 |
发表于 2016-5-1 11:52:27
|
显示全部楼层
3.尤金·加菲尔德的创业
SCI和JCR这两种数据行用半个世纪,已经极大地改变了国际科学界的学术生态和发表机制。他们的创立者尤金·加菲尔德不管历史功过如何,已经足以名垂青史。
加菲尔德一九二五年生于纽约布朗克斯区,从哥伦比亚大学获化学学士学位(一九四九)和图书情报学硕士学位(一九五四),从宾夕法尼亚大学获结构语言学博士学位(一九六一)。一九五六年,还在攻读博士学位的加菲尔德已经注册成立了一家小公司,推出了第一款信息产品《目录快讯》(Current Contents,简称CC),是一种对管理类杂志目录进行定期汇编的小册子。除了零售散卖,贝尔实验室(Bell Lab)成为他的第一家企业用户。加菲尔德后来回忆,为了完成贝尔的订单,需要先投入五百美元作为印刷费,而这在他白手起家的早期不是一笔小数目,他从私人银行贷款才勉强渡过难关。
一九六〇年加菲尔德迎来了他事业的转折点。这年他将公司改名“科学情报研究所”,与美国国家健康学会合作,获得国家科学基金(NSF)三十万美元,共同承担建设“基因文献引用索引库”(Genetics Citation Index)项目。该项目对一九六一年二十八个国家出版的六百一十三种期刊两万册以上的一百四十万条参考文献建立引用索引,进行编目,最终结果共五卷,其中基因类文献引用索引独立成一卷。一九六三年该项目顺利结项,加菲尔德原指望国家科学基金继续提供资助,将余下四卷一起出版,但他的申请未获批准。加菲尔德于是决定自己来干,独立出版,并将五卷统一命名为“科学引用索引”,即科学界现今奉为圭臬的SCI。

SCI收录一定范围数量的期刊——通常被称为“源刊”(source journals),通过在源刊文本和源刊参考文献之间建立“引用索引”(Citation Index),可提供检索学者的 SCI论文发表数量和被引用次数——在理工科领域,对学者学术水平的评判现今主要取决于这类数据。1964年加菲尔德首次出版一九六一年的SCI报告,此后逐年出版,延续至今。他又先后在一九七三和一九七八年开始推出“社会科学引用索引报告”( Social Science Citation Index ,简称SSCI)和“艺术及人文科学引用索引报告”(Arts & Humanities Citation Index,简称A&HCI),完全套用了 SCI 的产品思路和模式。
从起源上看,“引用索引”的想法并非加菲尔德首创,它是受到美国一种判例援引法律工具书的启发。美国法律遵照“判例”原则, 法院进行判决时,必须与本院或上级法院此前对相似案例做出的判决保持一致。一八七三年,芝加哥法律出版商谢帕德(F. Shepard)开始出版一种他自己编印的工具书,在判例和援引案例之间建立索引, 统一编列并标记判例是否已被推翻、撤销、修改或加入限制条件。这种工具书能帮助律师快速了解一个判例是否仍然适宜援引,出版后大受欢迎,法律界人士几乎人手一本。谢帕德的名字甚至衍化出一个法律术语“Shepardize”,意为“查阅《谢帕德引证》”。
而作为一种期刊评估手段,JCR的思想源头可追溯至格罗斯(Gloss)夫妇一九二七年发表在《科学》(Science)上的一篇文章。他们试图解决这样一个问题:在图书馆预算有限的情形下,应该参照什么标准为学生购买供查阅的化学期刊?最简便的方法,当然是找一个权威专家为图书馆开列一个目录清单,但这会受到专家个人局限的左右。格罗斯夫妇的解决方案,是选取知名刊物《美国化学学会杂志》,对它一九二六年发表的两百四十七篇文章的三千六百三十三条参考文献进行统计,按引用次数对所有被引刊物进行排序,刊物重要性与排序结果直接对应,图书馆可参照此清单进行购买。这种筛选方式操作简便,且不存在太高专业“门槛”,很快被其他信息科学家借鉴推广到别的学科领域。
SCI 作为 JCR 的数据基础,相较前人有所突破的地方在于,不再区分学科类别,收录期刊海量增加。但根本区别在于,格罗斯夫妇及其后继者们对期刊进行筛选时,还保持着非常“纯洁”的动机, 为的是服务学术,而SCI和JCR却不是这样,它们从一出生就是商业信息产品,“赚钱”是它们与生俱来的属性。
4.讲个故事推销产品:“影响因子”预测诺贝尔奖
加菲尔德白手起家,从最初五百美元都要靠私人银行贷款,发展到今天至少在科学界俨然有君临天下之势的“信息帝国”,确实堪称科学、信息、资本三者结合的传奇。这个帝国的所作所为是好是坏,“影响因子”本身是不是合理,还不是本文打算讨论的内容,要留待以后再说。但加菲尔德在推销他的产品时,手法高明而且不遗余力, 却不可不提。这里也姑举一例以见一斑。
加菲尔德千方百计要让他的信息商品位居高端,乃至凌驾于学术之上,他的关键手法之一是讲了一个动人的故事——SCI可以预测诺贝尔奖。
一九六五年,即SCI推向市场的次年,在美国海军研究办公室(Office for Naval Research)主办的一次学术会议上,加菲尔德做了大会报告。当时他迫切需要打开SCI的市场,所以这次大会报告很大程度上成为一次不失时机的产品推介。加菲尔德宣称,SCI有五项功能: 一、便于学者了解前人工作;二、可作为评估研究成果的手段;三、便于追踪研究成果的发表来源;四、可用于计算期刊的“影响因子”; 五、为科学史研究提供一种辅助手段。
在阐述第二项功能时,加菲尔德选择了最能撩拨学界敏感神经的“诺贝尔奖预测”来进行论证。他利用1964年首次出版的一九六一年度SCI报告,统计了一九六一年二十五万七千九百位学者的成果被SCI论文引用的情况,又统计了一九六二、一九六三年产生的十三位物理、化学和医学诺贝尔奖获得者的论文引用情况, 数据表明,该十三位学者在获得诺贝尔奖的前一年,他们的成果被SCI论文引用的平均数量和次数远高于一般水平。

2000年至2004年诺贝尔奖获奖者所发表的论文,得奖前四年里的年征引率与得奖后五年内的年征引率(来源:Scopus)
从表面上看,这确实表明优秀科学家群体有着更高的SCI论文被引用数,但这并不足以支撑加菲尔德的论断:SCI论文引用数可以反过来用于评估单个学者的学术水平。
事实上,就在两年前的一篇文章中,加菲尔德还主动发出警告, 利用论文引用次数评估科学家和科学成果可能存在风险,理由是“论文的影响和论文的重要性及意义是两码事”。他甚至非常恰如其分地引用了苏联李森科的例子,说明如果引用次数最多的作者应该获得诺贝尔奖,那就会得出李森科是苏联最伟大科学家的荒谬结论。而且在加菲尔德举例的十三位诺贝尔奖获得者中,已有一个明显反例: 按照加菲尔德的统计,一九六三年度物理学奖获得者约翰内斯·詹森(J. H. Jensen)一九六一年三篇论文的SCI引用才四次,连引用次数的平均值(5.51次)都未达到。
但是,加菲尔德在随后持续打造SCI产品“学术形象”的过程中, 却似乎完全忘记了自己当初发出的警告。从一九六五至一九八三年间,他先后撰写了三十多篇文章,力图证明SCI论文引用可以“预测”诺贝尔奖。
在一九九〇年的一篇综述文章中,加菲尔德引用他此前鼓吹此事的三十多篇文章,力图将所谓“高引作者名录”和诺贝尔奖联系起来。我们详细研究了加菲尔德这篇文章所提供的数据,发现他对数据的处理和使用至少存在着三个问题:
第一,加菲尔德非常明显地对数据进行“选择性呈现”。每年新增SCI论文数以万计,这些论文产生的引用会让SCI“高引作者名录”各年大不相同,因此截取年限不同,结果就不一样。加菲尔德提供的六组数据中,起始年份各不相同,截止都在一九九〇年(该文写于这年),截取年限依次为一年、一年、十一年、十四年、十三年和十五年,并无章法可循。事实上,一九六一至一九九〇年的三十年间,所有可能截取的年限共有四百六十五种,对应的“高引作者名录”就应该有四百六十五份——而加菲尔德仅仅给出了其中六份,呈样率不到1.3%,对于如此明显的选择性呈现,加菲尔德却没有交代任何理由(哪怕宣称是“随机抽取”)。
第二,加菲尔德没有说明“高引作者名录”人数的选取标准。因为名单越长,出现诺贝尔奖得主的概率也就越大。加菲尔德的六组数据,名单人数从最初的五十扩大到了后来的一千,却没有给出任何解释理由。
第三,没有明确预测的有效年限。通常,预测事件发生是有时限要求的。加菲尔德六组数据的预测年份截止于一九九〇年,只是因为他的文章写于这一年,这意味着预测的有效期限可能止于任何年份,这完全背离了“预测”的基本要求。
加菲尔德之后,有学者采用相同路径加入“预测”行列,这些工作对引导学界相信 SCI 论文“高引”可预测诺贝尔奖起了推波助澜的作用,而客观上则是在自觉或不自觉地帮助SCI推销产品。但对于这种“预测”,学界至今还存在相当大的异议。下面仅举一例:
学者金格拉斯(Y. Gingras)和华莱士(M. Wallace)二〇一〇年发表一项研究,他们对比物理和化学领域的两组数据:逐年统计一九〇一至二〇〇七年排名前五百的高引作者的被引用情况,和一九〇一至二〇〇七年三百三十位诺奖得主的被引用情况。统计结果显示,一九〇〇至一九四五年间,诺贝尔奖得主在获奖当年的平均被引用次数确实高于其他高引作者,出现一个突出的峰值;但是从一九四六至二〇〇七年,这样的峰值再未出现。这意味着,一九〇〇至一九四五年间,成果引用或许可以看作预测诺贝尔奖的有效风向标,但是从一九四六年以后,试图从“高引作者”中鉴别出诺贝尔奖得主已经完全没有可能。他们对这种变化提出的解释是:五十年代以来科研人数在急剧增加;同时专业分支在不断细化。如果他们的研究结论成立,那就表明:早在SCI作为一种商品被销售之前的大约二十年,它在“预测诺贝尔奖”这件事上就已经失效了。
一个对金格拉斯和华莱士两人上述研究结论非常有利的最新证据是:“科学情报研究所”二〇一四年公布的“高引作者名录”中, 尽管包括了多达三千二百一十六位科学人士,但该名录二〇一四年的诺贝尔奖“预测”命中率为零。
然而这并不妨碍“高引作者名录”继续受学界追捧。因为在“SCI引用”风行整个学界的今天,能进入该名录已经被当成学术水平突出的象征。更何况,鼓吹“预测诺贝尔奖”本来只是加菲尔德当年推销SCI产品时的一个手段,如今时移世易,SCI和“影响因子”的声势已经如日中天,能不能预测诺贝尔奖早已无关紧要了。
|
|