怎样评测论文中的创新度?

一篇论文的创新度,该用什么方法来测评?怎样才能识别呢?

怎样评测论文中的创新度?

根据托马斯•库恩的科学范式概念,创新型研究可分为两类,一是常规科学中的创新性研究,即在现有研究范式下对已有研究的补充和发展,推动科学的累积式渐进;二是导致科学革命的创新性研究,即通常是对原有研究范式的颠覆,属于具有革命性的科学突破,促成科学革命的发生[1]。库恩的精辟论述奠定了学术创新分类的基础[2,3]。

如何识别论文中的创新?这是一个困扰学术界已久的问题。

理想情况下,这个问题应该交给同行评议来解决。但现实上,难找到真正的同行加上难让真正的同行讲真话这两个障碍让学术界退而求其次,用替代方案来识别论文中的创新。对,你一定想到了,学术界就是在同行评议不可行的情况下,用科学计量指标来作为评价论文质量的替代方案,但请注意,这个替代方案离论文的质量差距还有点远,目前还只能反映论文的影响力。

按照科学计量指标的设计逻辑,论文创新的替代方案是什么?

1869年,俄国科学家门捷列夫据说在梦中获得了元素周期表的灵感,并创造出现代化学的元素周期律。自此,有关物质结构的研究似乎变得清晰了——无非是有限元素的排列组合。结构决定性质,这是化学家的哲学,但思想不止于此。

论文是否可以视为知识实体的组合?是,答案并不会有太多争议。但是,与元素周期表不同的是,论文并非是元素周期表中的有限元素的组合,而是“边组合边创新”。下面介绍几项基于『组合』的创新测度方案。

基于网络结构的测度——桥接

Foster等人用复杂网络描绘出论文中知识的演化。他们认为,科学家可能会在两个尚未建立联系的实体间建立一种联系,这种行为被视为一种超越当前知识的“跳跃”,也可能对两个已知的实体关系进行测验,从而得出一种新的关系(搭桥)或证实已有研究(巩固),如上图所示。同一族中的实体的增加是对现有知识的巩固和深化,它增强了族的稳健性(持续巩固)。不同聚类中的连接实体则形成转变知识网络连通性,将原本松散相连的结构变得更紧密的“桥梁”(持续搭桥)。

前 3 种策略属于不同程度“革命性思维”的结果,后 2 种属于不同程度“常规思维”的结果。Foster等人基于MedLine 生物医学论文的数据,发现生物医学领域常规科学产出较多,革命性产出少,并据此认为,生物医学正处于常规科学时期。

这种测度方案的核心是:发现改善网络连通性的节点或连线,如上图所示。简单的说,如果一项研究能把两个子网络上的文献连通,或者能把两项未连通的研究连通,这种『组合』能力(听上去有点像红娘)就是创新。

基于引用中期刊组合的测度

Uzzi等人非常巧妙地用文献计量学中的“共被引”(即论文参考文献中任意两两之间的关系)来构造“文献对”,以测度常规与创新的结合[5]。具体操作如下:将文献对转化为期刊对(Web of Science数据库所有学科的1790万篇论文构成超过1.22亿个期刊对)之后,通过期刊所属的学科领域,基于随机引文网络,用标准化指标Z Score来测度“文献对”中知识的结合的创新程度:Z Score大于0,表示文献对中知识的结合较传统;Z Score小于0,表示文献对中知识的结合较创新。

王健等人采用了一种“组合新颖性”的视角来量化科学研究中的新颖性[6]。新颖性被定义为通过新颖的方式对已有的知识碎片进行重新组合。与Uzzi等人做法不同的是,王健等人关注的是一篇论文的参考文献中出现的某对期刊先前是否已被其他文献同时引用过。他们发现,新颖的论文在引文分布上有较大的差异,更可能出现在高影响或者低影响文献的尾部,反映出“高风险”特征。

这种测度方案的核心是:一项研究如果在参考文献中『组合』了之前未被组合过的参考文献(听上去有点像第一个吃螃蟹的人),即被视为创新。

值得注意的是,目前这些研究所采用的组配的方式显得过于直白,如何优化,是一个值得研究的问题。

发表评论

邮箱地址不会被公开。 必填项已用*标注