论文部分内容阅读
引文影响指标是基于科技文献的引用数量建立的科学影响力的度量指标,并在科研评估,文献推荐,信息检索系统等许多系统中被广泛应用。其中,引文影响指标在评估科研人员,研究团队,研究机构和大学等科学影响力起到了重要作用。引文影响指标的主要思想是通过定量衡量科技文献在其他科技文献被引次数来定量衡量其科学影响力。传统引文影响指标没有考虑科技文献在施引文献中如何被引用,只关注被引次数,忽略了每个引文的具体作用,并影响了对科学影响力评估的准确性。本文提出了基于全文引文分析的引文影响指标的研究方法,并基于引文提及频率揭示了引文分布的特征。通过基于引文提及频率的引文统计分布和科技文献之间的相关性分析,表明了引文提及频率是一种能够反映科学影响力的有效度量特征,并且提出了考虑引文提及频率的引文影响指标。论文的研究内容如下:
首先,本文研究根据引文提及频率引文的统计分布特征。事实上,每个参考文献在施引文献中真正被提到的次数彼此不同,引文提及频率是一个能够反映每篇参考文献对施引文献的具体作用的明确的全文引文特征。因此,基于引文提及频率来表达引文统计分布,对于利用引文提及频率来建立新的引文影响指标至关重要;本研究检验了6种期刊的引文提及情况,并用回归分析来推断引文统计分布的理论分布函数;然后,使用Kolmogorov-Smirnov检验来验证经验分布函数和理论分布函数之间的拟合度;通过引文提及的统计分布分析,揭示引文提及统计分布遵循广义帕累托分布,以及引文提及中存在的80/20规则。
其次,本文研究施引文献与不同引文提及频率的被引文献之间相关性的差异。科技文献因其自己的内容和施引文献之间的相关性而被引用。因此,引文提及频率的差异有可能意味着相关性的差异。本研究从两个角度(引文关系和内容)进行分析;一方面,使用共引用参考文献的数量来检查参考的相关性,另一方面,使用科技文献摘要文本来检查内容的相关性。通过相关性分析,揭示引文提及频率较高的被引文献比引文提及频率较低的被引文献跟施引文献更有密切的相关,从而验证所提出的假设。
最后,本文提出考虑引文提及频率的引文影响指标。引文提及频率代表被引文献对施引文献的贡献和它们之间的相关性,因此,本研究提出基于引文提及频率的引文影响指标,并使用Spearman相关分析来将其与传统引文影响指标进行比较,验证所提出的引文影响指标的有效性。
首先,本文研究根据引文提及频率引文的统计分布特征。事实上,每个参考文献在施引文献中真正被提到的次数彼此不同,引文提及频率是一个能够反映每篇参考文献对施引文献的具体作用的明确的全文引文特征。因此,基于引文提及频率来表达引文统计分布,对于利用引文提及频率来建立新的引文影响指标至关重要;本研究检验了6种期刊的引文提及情况,并用回归分析来推断引文统计分布的理论分布函数;然后,使用Kolmogorov-Smirnov检验来验证经验分布函数和理论分布函数之间的拟合度;通过引文提及的统计分布分析,揭示引文提及统计分布遵循广义帕累托分布,以及引文提及中存在的80/20规则。
其次,本文研究施引文献与不同引文提及频率的被引文献之间相关性的差异。科技文献因其自己的内容和施引文献之间的相关性而被引用。因此,引文提及频率的差异有可能意味着相关性的差异。本研究从两个角度(引文关系和内容)进行分析;一方面,使用共引用参考文献的数量来检查参考的相关性,另一方面,使用科技文献摘要文本来检查内容的相关性。通过相关性分析,揭示引文提及频率较高的被引文献比引文提及频率较低的被引文献跟施引文献更有密切的相关,从而验证所提出的假设。
最后,本文提出考虑引文提及频率的引文影响指标。引文提及频率代表被引文献对施引文献的贡献和它们之间的相关性,因此,本研究提出基于引文提及频率的引文影响指标,并使用Spearman相关分析来将其与传统引文影响指标进行比较,验证所提出的引文影响指标的有效性。