论文部分内容阅读
随着格式化全文数据的出现,基于全文数据的引文分析,或全文引文分析,变得更加方便。全文引文分析方法,通过识别和分析引文在施引文献正文中的具体引用位置、引用次数和引用语境,从而在微观上揭示引用的特征和规律,发现引用背后的动机和机理,识别引文在施引文献中的功能和作用。在对基于全文的引用行为研究进行综述的基础上,本文提出一种由引用位置、引用强度和引用语境组成的全文引文分析的研究框架,可以系统而全面地对科学论文正文中的引用信息进行分析和研究。在本文中,我们选取Journal of Informetrics期刊作为案例,在Elsevier ConSyn数据库中下载XML格式全文数据,并导入到个人开发的全文引文分析系统中提取其中的引用信息,然后从上面三个维度对这些引用行为信息进行了分析和研究。从引用位置来看,引文的引用位置分布极不平均,接近一半的引用分布在论文的前30%,也就是"Introduction"一节所在的位置;引用经常成群成簇出现,以增加引用的论证力度;一般地,发表时间越早的文献在施引文献中的引用位置越靠前;高被引引文的引用位置也比低被引引文的引用位置靠前。从引用强度来看,Journal of Informetrics期刊论文中平均每篇引文的引用强度是1.5左右,也就是说,引文的多引现象比较普遍;对同一引文的多次引用一般发生在同一节中,而不是两个不同的节中。引用强度的大小与引文是否为高被引论文没有明显的相关性,但与引文的发表年份有关。年轻引文的引用强度通常高于经典引文。从引用语境来看,不同位置和强度的引用语境中所包含的内容词和线索词有很大区别。例如,在第一节中的引用语境包含了更多关于研究背景的表达,而在其他各节中则更多的是表达方法和结果;在多引的情况下,初次引用的引用语境更宏大叙事,再次引用时的引用语境更具体而微。引用语境还与引文的年龄和被引次数有关,比如经典的、高被引论文的引用语境通常采用第三人称的视角,而最新的、低被引论文的引用语境通常采用第一人称的视角。全文引文分析具有重要的理论意义和应用价值。对施引文献正文中的引用的分析和研究推动了文献计量学的发展,拓展了经典引文分析方法的功能,增进了我们对科学论文写作中引用规范的了解。本文通过三个案例展示了全文引文分析方法在科学文献检索、科学评价与预见和科学知识图谱构建等科研问题上的具体应用。