论文部分内容阅读
摘 要 运用关键词分析原理,对1994—1996年《图书情报工作》论文关键词的特征进行统计分析,并着重探讨关键词的概念及其分布。
关键词 关键词分析 文献计量学
关键词分析(keywordanalysis)是文献计量学的重要组成部分。通过对关键词的分析,研究文献的内在规律,对期刊、人才及科研成果进行科学评价,揭示学科特点、结构及内在相关性;反映科研的研究热点和发展动向,对情报学、科学学等诸多领域的研究有至关重要的作用。1982年日本学者曾对中文经典著作中的关键词应用聚类分析方法进行了研究,从而查明了全文的主题结构。1991年又用內容词分析和引文共引聚类分析相结合的方法对生物化学等领域内重要文献进行了研究。
一、关键词分析的原理
随着科学的发展,科学的交叉和渗透越来越明显。科技文献中用作关键词的专业术语和词汇越来越多。文献关键词的变化可以显示科学发展、交叉、渗透和兴衰的趋势。通过对关键词的分析,可以发现科学研究的热点和发展动向。其理论依据是:①科学研究的热点是由一系列内容密切相关的研究课题和概念组成的,这些热点是众多著者共同密切关注的对象。②热衷于某一科学热点研究的著者对于同一课题和概念,所使用的词汇基本趋于一致。③从事同一研究课题的不同著者的论文因使用的关键词相偶合会形成一个小的集合,从而形成以某专业为核心的一个个程度不同的著者群或文献群。著者之间或许互不相识,但他们之间却存在潜在的联系。④由于论文是关键词的携带者,又能被引用作参考文献,因而关键词分析与引文分析的结果应基本一致。
二、论文关键词特征
论文关键词特征主要包括:论文关键词的概念及关键词的数量特征;论文关键词之间偶合关系的特征。此外,还有关键词之间的搭配关系特征。限于篇幅,对此暂不论及,只就概念及其数量分布进行分析和研究。
(1)关键词概念及其数量分布关键词是指那些出现在文献的篇名、摘要或正文中,对表征文献主题内容有实际意义的语词,亦即对揭示和描述文献主题内容来说是最重要的并可作为检索入口的那些语词,是论文主要内容的概括。经过统计,1994—1996年《工作》中共发表论文297篇,有关键词的论文290篇,共设关键词851个,每篇论文平均关键词为2.9个。
从篇名抽取关键词作为检索入口,就可检索到全部论文的61.7%;研究篇名关键词、摘要关键词以及正文关键词对情报检索、咨询都是很有用处的。
(2)不同数目关键词的论文及其词频分布如上所述,关键词是为文献标引工作从篇名、摘要、正文中选取出来的用以表示全文主题内容、信息款目的语词。一般要求每篇论文选取3—8个词作为关键词。
虽然关键词数不能说明论文水平的高低,但可以反映论文规范化程度,也即《工作》的关键词规范化程度越来越高。对少数论文关键词数目偏低的现象,有待进一步规范。
三、关键词偶的概念及其分布
(1)关键词偶的概念及其相关特性1963年凯斯勒提出了文献偶合的思想。所谓文献偶合,是指两篇论文共同引用了一篇或多篇受引论文,人们称这两篇论文发生了偶合关系。但在科学论文标引关键词时,我们经常会看到不同论文的作者不约而同地引用了一个或数个完全相同的关键词。如把引文偶合的思想普及于关键词引用,那么可以认为:两篇论文共同引用了一个或数个完全相同的关键词,则这两篇论文便发生了偶合关系。我们不妨把这种偶合关系叫做关键词偶。这个“偶”无形中把离散的论文著者联系起来,形成以某专业为核心的一个个程度不同的著者群和论文群。如果引用了一个共同的关键词,关键词偶为1,引用了2个共同的关键词,关键词偶则为2……如果共同受引的关键词数目越多,则施引论文的关键词偶越大。关键词偶的数量决定论文相关强度。关键词偶像一条条无形的链把有关的著者链引成一个个著者群;把相关文献链引成一个有机的论文群体。
(2)关键词偶的分布经统计:1994—1996年,《工作》中论文关键词偶最多的只有3个。统计中看到,关键词偶数相同,但不同概念的关键词偶的关联程度是不同的。
我们可以依据关键词偶的数值来判定某些著者、文献、期刊乃至学科的亲疏程度,可以分析其主体结构,对文献或著者乃至学科进行计量分析,对充实文献计量学理论有着积极的作用。
四、结语
本文介绍的关键词分析方法是国内最新成果,是引文分析和情报检索科学化、定量化的深化,在研究文献主题方面具有发展前景,是文献计量学走向定量化、精确化,宏观和微观相结合的突破点。
但是,任何一种分析方法都不可能没有缺点。关键词的统计分析也一样,其统计分析的精确性往往受到著者标引关键词的人为影响,不同的标引方法会产生不同的分析效果。只要能有所规范,这种影响会降低到最低限度。
参考文献:
[1]张琪玉.情报检索语言武汉:武汉大学出版社,1985
[2]罗式胜.篇名关键词链特征的统计分析及应用中国
关键词 关键词分析 文献计量学
关键词分析(keywordanalysis)是文献计量学的重要组成部分。通过对关键词的分析,研究文献的内在规律,对期刊、人才及科研成果进行科学评价,揭示学科特点、结构及内在相关性;反映科研的研究热点和发展动向,对情报学、科学学等诸多领域的研究有至关重要的作用。1982年日本学者曾对中文经典著作中的关键词应用聚类分析方法进行了研究,从而查明了全文的主题结构。1991年又用內容词分析和引文共引聚类分析相结合的方法对生物化学等领域内重要文献进行了研究。
一、关键词分析的原理
随着科学的发展,科学的交叉和渗透越来越明显。科技文献中用作关键词的专业术语和词汇越来越多。文献关键词的变化可以显示科学发展、交叉、渗透和兴衰的趋势。通过对关键词的分析,可以发现科学研究的热点和发展动向。其理论依据是:①科学研究的热点是由一系列内容密切相关的研究课题和概念组成的,这些热点是众多著者共同密切关注的对象。②热衷于某一科学热点研究的著者对于同一课题和概念,所使用的词汇基本趋于一致。③从事同一研究课题的不同著者的论文因使用的关键词相偶合会形成一个小的集合,从而形成以某专业为核心的一个个程度不同的著者群或文献群。著者之间或许互不相识,但他们之间却存在潜在的联系。④由于论文是关键词的携带者,又能被引用作参考文献,因而关键词分析与引文分析的结果应基本一致。
二、论文关键词特征
论文关键词特征主要包括:论文关键词的概念及关键词的数量特征;论文关键词之间偶合关系的特征。此外,还有关键词之间的搭配关系特征。限于篇幅,对此暂不论及,只就概念及其数量分布进行分析和研究。
(1)关键词概念及其数量分布关键词是指那些出现在文献的篇名、摘要或正文中,对表征文献主题内容有实际意义的语词,亦即对揭示和描述文献主题内容来说是最重要的并可作为检索入口的那些语词,是论文主要内容的概括。经过统计,1994—1996年《工作》中共发表论文297篇,有关键词的论文290篇,共设关键词851个,每篇论文平均关键词为2.9个。
从篇名抽取关键词作为检索入口,就可检索到全部论文的61.7%;研究篇名关键词、摘要关键词以及正文关键词对情报检索、咨询都是很有用处的。
(2)不同数目关键词的论文及其词频分布如上所述,关键词是为文献标引工作从篇名、摘要、正文中选取出来的用以表示全文主题内容、信息款目的语词。一般要求每篇论文选取3—8个词作为关键词。
虽然关键词数不能说明论文水平的高低,但可以反映论文规范化程度,也即《工作》的关键词规范化程度越来越高。对少数论文关键词数目偏低的现象,有待进一步规范。
三、关键词偶的概念及其分布
(1)关键词偶的概念及其相关特性1963年凯斯勒提出了文献偶合的思想。所谓文献偶合,是指两篇论文共同引用了一篇或多篇受引论文,人们称这两篇论文发生了偶合关系。但在科学论文标引关键词时,我们经常会看到不同论文的作者不约而同地引用了一个或数个完全相同的关键词。如把引文偶合的思想普及于关键词引用,那么可以认为:两篇论文共同引用了一个或数个完全相同的关键词,则这两篇论文便发生了偶合关系。我们不妨把这种偶合关系叫做关键词偶。这个“偶”无形中把离散的论文著者联系起来,形成以某专业为核心的一个个程度不同的著者群和论文群。如果引用了一个共同的关键词,关键词偶为1,引用了2个共同的关键词,关键词偶则为2……如果共同受引的关键词数目越多,则施引论文的关键词偶越大。关键词偶的数量决定论文相关强度。关键词偶像一条条无形的链把有关的著者链引成一个个著者群;把相关文献链引成一个有机的论文群体。
(2)关键词偶的分布经统计:1994—1996年,《工作》中论文关键词偶最多的只有3个。统计中看到,关键词偶数相同,但不同概念的关键词偶的关联程度是不同的。
我们可以依据关键词偶的数值来判定某些著者、文献、期刊乃至学科的亲疏程度,可以分析其主体结构,对文献或著者乃至学科进行计量分析,对充实文献计量学理论有着积极的作用。
四、结语
本文介绍的关键词分析方法是国内最新成果,是引文分析和情报检索科学化、定量化的深化,在研究文献主题方面具有发展前景,是文献计量学走向定量化、精确化,宏观和微观相结合的突破点。
但是,任何一种分析方法都不可能没有缺点。关键词的统计分析也一样,其统计分析的精确性往往受到著者标引关键词的人为影响,不同的标引方法会产生不同的分析效果。只要能有所规范,这种影响会降低到最低限度。
参考文献:
[1]张琪玉.情报检索语言武汉:武汉大学出版社,1985
[2]罗式胜.篇名关键词链特征的统计分析及应用中国