论文部分内容阅读
Hirsch教授于2005年提出的h指数在国内外信息计量和科学评价领域引起了很大的反响。它不仅用于对科学家个人或群体学术绩效的评价,同时也应用于对学术期刊影响力及专利信息的评价研究。本文旨在通过对h指数的相关介绍,分析了h指数评价科研人员学术产出时的影响因素,最后提出了若干修正及校正方法和建议,对于h指数在国内的准确应用具有重要的意义。
一、引言
如何评价科研人员的学术成就和学术影响,是人们一直在努力探索的课题。多数科研人员认为同行评议是评价一个科研人员学术成就的最基本的方法,如果同行评议机制严格、得当、评审专家作风正派、了解情况全面,能够得出客观公正的定性评价结果。但在评议机制不够严格和信誉制度不够完善的情况下,往往存在重人情拉关系、本位主义等现象,影响到评价工作的客观公正性。因此,一些文献计量学家开始采用引文量、期刊影响因子等指标来对学术成就进行定量评价,然而研究发现,这些传统的文献计量指标有微观层次上,特别是对科学家个人进行学术评价时存在很多问题。
2005年,美国加州大学圣地亚哥分校物理学家J.E.Hirsch提出了一种新的文献计量方法 —h指数(h-index)用以评价科学家个人的学术成就。该指数创新性地将科学家学术论文的产出量(论文数)和质量(引文数)结合为一个单一指标,意在用于衡量科研人员个人学术成就。h指数刚一公布就引起了广泛的关注,Nature和Science都相继进行了报道。h指数不仅用于对科学家个人或群体学术绩效的评价,同时也应用于对学术期刊影响力的评价研究及专利信息中专利权人的研究。因此,本文旨在通过对h指数的相关介紹,指出并分析h指数在评价科研人员学术产出时的影响因素,并提出了若干修正及校正方法和建议,对于h指数在国内的准确应用具有重要的意义。
二、h指数相关概述
(一) h指数的定义
Hirsch将科学家个人h指数定义为:当且仅当某科学家发表的NP 篇论文中有h篇论文每篇至少获得了h次的引文数,其余的 NP-h 篇论文中各篇论文的引文数都小于或等于h时,此h值就是该科学家的h指数。他认为h指数能够准确地反映出科研人员的学术成就,一个人的h指数越高,则表明他的论文及学术影响力就越大。h指数把文章的被引用率作为衡量研究工作的内在指标,而论文数量作为参考指标,这在一定程度上反应了科研工作者的个人成就,但它也可以用于评价工作者的群体和学术期刊。
(二)h指数的优缺点
Hirsch提出h指数的初衷就是用于对科学家个人总体学术成就的评价。h指数巧妙地将数量指标(发表的论文数量)和质量指标(被引频次)结合在一起,同时对论文产出力和论文影响力进行测量,克服了以往各类单项指标的缺点与不足。h指数高不仅表明评价对象发表的论文质量高,而且表明高质量论文的数量多,因而相比传统文献计量单项指标只能体现数量的缺憾有明显优势,是近年文献计量学指标研究的一项重要成果和进展。
据Hirsch的定义:“一个科学家的分值为h,当且仅当他/她所发表的N篇论文中有h篇论文每篇至少被引用了h次,而其余论文每篇至多被引用了h次”。h指数的基本应用是基于引文分析的个人学术产出和影响力,然而h指数的准确应用受到诸多因素影响。如定义中所指“作者所发表N篇论文”这一说法就存在很大争议,因定义对N篇论文的归属权问题没有做进一步的阐释,这N篇指的是所有参与的N篇(包括本人作为第一作者、通讯作者等),还是作为第一作者的N篇或作为通讯作者的N篇,还有作者重名、学科、数据库及自引等问题。这些因素都将影响其h指数计算的准确性。
三、h指数评价科研人员学术产出的影响因素分析
(一)重名对科研人员h指数的影响
国内外各数据库中作者重名问题一直影响着学术评价指标的准确性,h指数也不例外。根据Hirsch的定义及数据模型推理可以看出,h指数代表四层意思:h篇论文;每篇至少被引h次;总被引至少h2次;总被引大约为(3~5)h2。h指数相差1,总被引大约相差3~5倍(2h一1),h指数的增加体现的是作者论文数量变化过程中的部分质变。因次,作者h指数测算的准确性至关重要。
在我国,重名问题尤为严重。科学引文索引等一些国外权威数据库中,我国科学家的名字只取汉语拼音的首字母,更加混淆了作者身份。部分数据库公司己经意识到这一问难的严重性,并在这方便做了很多技术方面的尝试,如Scopus数据库的作者身份标示系统 (author identifloation),为每个作者分配一个固定 ID(Ideniification,身份识别码),且支持中国作者名字的汉语拼音全拼检索。此外,每个ID均有明确的单位标示,这在很大程度上缓解了重名问题对作者h指数的影响。然而,还有很多数据库目前还没有能力实现或正在实现以上技术。如何利用这些数据库自身检索特点结合相关手动检索技术更好地减少重名问题对于作者h指数的影响,对h指数准确应用具有重要意义。
(二)科研工作性质对作者h指数的影响
根据Hirsch的定义,h指数适用的前提条件是作者应发表一定数量的论文,且这些论文要被相关数据库收录。其适用范围总体上应以从事理论研究及基础研究的科研人员为主。基础研究成果多强调学术价值,其绩效表现多以科学论文和学术专著为主。应用研究成果以应用前景为评价标准,绩效表现形式以技术论文、技术专著和专利为主,专利形式比论文形式更能体现其技术特征。但这并不妨碍h指数的应用,因从事技术研究开发的科学家,也有论文发表,甚至比从事基础研究的科学家还要多,且从事基础研究的科学家,同样也有专利产出等等。科学家所从事科研工作的性质通过其所在学科得以反映,因此,可以通过学科进行科研工作类型分类。
(三)学科因素对作者h指数的影响
学科间规模、发展阶段、发展速度、活跃程度等特征不同,学科间科研人论文产出及引文规律也不尽相同,甚至学科内也是如此,因此,学科间学科内研人员之间h指数也应不同。Hirsch对各个领域的科学家进行了统计分析,发各学科有成就的科学家确实有相对较高的h指数值,且各学科间h指数存在很差异。物理领域h指数最高的E.Witten,h=110;生物学家当中h指数最高SolomonH.Snyder,高达191,其次为加州理工学院生物学家David Baltimore,其h值为160。Hirsch通过测算发现生命科学领域科学家的h指数要明显高于理学领域科学家的h指数。这表明h指数像其他指标一样,不太适合直接用于科间科学家之间的比较。
各学科间科学家个人h指数的不可比性,在宏观层面上应表现为学科间h指数的差异。仿照Hirsch的定义,将学科h指数界定为“某学科的h指数是指该学科有h篇最低被引为h次的论文”。由于学科划分的相对性和层次性,同属医学一级学科的各二级学科间也应具备学科h指数的差异。通过系统分析医学一级学科的各二级学科间h指数的差异,进一步说明学科对于科研人员h指数的影响,并提出可行的校正方法,以使得学科间科研人员h指数具有可比性。
(四)自引对作者h指数的影响
h指数是基于引文分析的评价指标,基于引文分析指标多少会受到作者自引的影响。自引要分别对待恶性自引和良性自引,恶性自引近乎炫耀家底,良性自引可以见出研究的系列性、渐进性,体现学术成长历程和延续性,是正常学术规范,无可厚非。然而,当引文指标用于评价科学家个人学术成就时,类似论文作者自引部分理应排除,因自引并不能体现该文章学术影响力。自引又包括作者本人自引和合作者的引用。当然,自引会增大作者h指数,但Hirsch在文章中说作者自引对于h指数的影响很小,即使需要校正也是少数。有人分析了一组生物进化学领域科学家的h指数,发现排除自引后h指数平均降低了12.3%,信息科学高影响力科学家自引排出后h指数最多的下降了3,平均下降了0.9%或6.6%。本文则分别以国内化学部有效增选院士和ISI生物与生物化学及化学领域高被引科学家为例进一步探讨自引对于作者h指数影响,以及自引校正必要性。
四、相关的对策及建议
以上针对文献计量新指标h指数定义及评价科学家个人学术成就过程中所存在的主要影响因素进行了研究,其中包括数据库选择、作者重名、科研工作性质、学科及作者自引等问题。分析这些影响因素对于h指数影响的基础上,提出了若干修正及校正方法和建议,其中包括:
(1)针对作者重名问题对于国内科学家h指数影响,提出了组合检索策略并对作者单位组合检索进行了深入研究。针对科学家经常变迁单位问题,提出测算频繁变迁工作的科研人员的h指数时,应充分调查其工作履历,进行多机构复合检索,以便提高查全率;针对大学及机构因合并、建制、扩充等因素更换单位名称而相应数据库没有及时进行相应修改等问题,提出检索这类作者论文应格外注意,应进行单位改名前后多机构组合检索;针对机构名称变更或书写不规范等因素所引起的检索不全等问题,可通过单位邮编组合进行检索。
(2)针对科研工作性质对作者h指数的影响,理论结合检索实践对h指数适用性进行了初步分类:从事基础理论类性质研究工作的科研人员适用性较高;从事技术应用开发类性质研究工作适用性一般;从事保密性质类研究工作的科研人员基本上不适用。
(3)针对学科因素对作者h指数的影响,提出将不同学科科技人员个人的h指数进行标化后比較或分学科比较,标化方法:将科学家个人h指数除以其学科h指数,再乘上100。
(4)针对国内外作者自引比例差异,不同学科作者自引比例差异,提出用排除自引后h指数后进行评价会更准确。
然而,准确评价科学家个人学术成就是个很复杂的工程,其中除以上述涉及的问题外,还包括其年龄、从事科研时间、性别、国家语种差别、“马太效应”、论文“友情互引”及“论文反引”等问题,这些问题的存在在很大程度上限制了基于引文分析指标潜能的发挥。单纯就文献计量指标而言,h指数、论文总数、引文总数、篇均被引次数、高被引论文次数等均不同程度存在以上问题,因此,应用时均需综合全面考虑。基于以上分析,作者h指数相对较适用于国内科学精英的学术产出和学术影响力评价,且应遵守“同库同行同单位同性同年龄段相比”原则。
五、结语
评价科研人员的学术成就,仅凭其发表的论文总数并不妥,还要看这些论文的质量。但将期刊的影响因子等同论文的质量指标也是不妥的,必须具体地看其论文的情况,总体地衡量其论文的被引用情况。Hirsch提出的h指数巧妙地将数量指标(发表的论文数量)和质量指标(被引频次)结合在一起,同时对论文产出力和论文影响力进行测量,克服了以往各种单项指标的缺点与不足。尽管文献计量学家一再告诫,用文献计量学方法评价科研绩效的最小单位应该是科研小组,对科研人员个人进行绩效评价意义不大,甚至是危险的。但是,在现实的科研管理中,经常会有对个人绩效进行评价的需求,因此,不能回避这一问题,而是采取措施,不断地改进和完善个人层面的绩效评价工作。
参考文献:
[1]赵基明,邱均平,黄凯,刘兵红.一种新的科学计量指标.中国科学基金[J].2008(2).
[2]赵明基,舒明全.基于CSSCI的《中国图书馆学报》h指数及核心作者测定[J].中国图书馆学报,2008(2).
[3]刘合艳,房俊民,苑彬成.h指数研究及应用概述[J].情报理论与实践,2009(11).
(作者简介:李军(1970.6-),男,讲师,湖北国土资源职业学院工商管理系电子商务教研室。)
一、引言
如何评价科研人员的学术成就和学术影响,是人们一直在努力探索的课题。多数科研人员认为同行评议是评价一个科研人员学术成就的最基本的方法,如果同行评议机制严格、得当、评审专家作风正派、了解情况全面,能够得出客观公正的定性评价结果。但在评议机制不够严格和信誉制度不够完善的情况下,往往存在重人情拉关系、本位主义等现象,影响到评价工作的客观公正性。因此,一些文献计量学家开始采用引文量、期刊影响因子等指标来对学术成就进行定量评价,然而研究发现,这些传统的文献计量指标有微观层次上,特别是对科学家个人进行学术评价时存在很多问题。
2005年,美国加州大学圣地亚哥分校物理学家J.E.Hirsch提出了一种新的文献计量方法 —h指数(h-index)用以评价科学家个人的学术成就。该指数创新性地将科学家学术论文的产出量(论文数)和质量(引文数)结合为一个单一指标,意在用于衡量科研人员个人学术成就。h指数刚一公布就引起了广泛的关注,Nature和Science都相继进行了报道。h指数不仅用于对科学家个人或群体学术绩效的评价,同时也应用于对学术期刊影响力的评价研究及专利信息中专利权人的研究。因此,本文旨在通过对h指数的相关介紹,指出并分析h指数在评价科研人员学术产出时的影响因素,并提出了若干修正及校正方法和建议,对于h指数在国内的准确应用具有重要的意义。
二、h指数相关概述
(一) h指数的定义
Hirsch将科学家个人h指数定义为:当且仅当某科学家发表的NP 篇论文中有h篇论文每篇至少获得了h次的引文数,其余的 NP-h 篇论文中各篇论文的引文数都小于或等于h时,此h值就是该科学家的h指数。他认为h指数能够准确地反映出科研人员的学术成就,一个人的h指数越高,则表明他的论文及学术影响力就越大。h指数把文章的被引用率作为衡量研究工作的内在指标,而论文数量作为参考指标,这在一定程度上反应了科研工作者的个人成就,但它也可以用于评价工作者的群体和学术期刊。
(二)h指数的优缺点
Hirsch提出h指数的初衷就是用于对科学家个人总体学术成就的评价。h指数巧妙地将数量指标(发表的论文数量)和质量指标(被引频次)结合在一起,同时对论文产出力和论文影响力进行测量,克服了以往各类单项指标的缺点与不足。h指数高不仅表明评价对象发表的论文质量高,而且表明高质量论文的数量多,因而相比传统文献计量单项指标只能体现数量的缺憾有明显优势,是近年文献计量学指标研究的一项重要成果和进展。
据Hirsch的定义:“一个科学家的分值为h,当且仅当他/她所发表的N篇论文中有h篇论文每篇至少被引用了h次,而其余论文每篇至多被引用了h次”。h指数的基本应用是基于引文分析的个人学术产出和影响力,然而h指数的准确应用受到诸多因素影响。如定义中所指“作者所发表N篇论文”这一说法就存在很大争议,因定义对N篇论文的归属权问题没有做进一步的阐释,这N篇指的是所有参与的N篇(包括本人作为第一作者、通讯作者等),还是作为第一作者的N篇或作为通讯作者的N篇,还有作者重名、学科、数据库及自引等问题。这些因素都将影响其h指数计算的准确性。
三、h指数评价科研人员学术产出的影响因素分析
(一)重名对科研人员h指数的影响
国内外各数据库中作者重名问题一直影响着学术评价指标的准确性,h指数也不例外。根据Hirsch的定义及数据模型推理可以看出,h指数代表四层意思:h篇论文;每篇至少被引h次;总被引至少h2次;总被引大约为(3~5)h2。h指数相差1,总被引大约相差3~5倍(2h一1),h指数的增加体现的是作者论文数量变化过程中的部分质变。因次,作者h指数测算的准确性至关重要。
在我国,重名问题尤为严重。科学引文索引等一些国外权威数据库中,我国科学家的名字只取汉语拼音的首字母,更加混淆了作者身份。部分数据库公司己经意识到这一问难的严重性,并在这方便做了很多技术方面的尝试,如Scopus数据库的作者身份标示系统 (author identifloation),为每个作者分配一个固定 ID(Ideniification,身份识别码),且支持中国作者名字的汉语拼音全拼检索。此外,每个ID均有明确的单位标示,这在很大程度上缓解了重名问题对作者h指数的影响。然而,还有很多数据库目前还没有能力实现或正在实现以上技术。如何利用这些数据库自身检索特点结合相关手动检索技术更好地减少重名问题对于作者h指数的影响,对h指数准确应用具有重要意义。
(二)科研工作性质对作者h指数的影响
根据Hirsch的定义,h指数适用的前提条件是作者应发表一定数量的论文,且这些论文要被相关数据库收录。其适用范围总体上应以从事理论研究及基础研究的科研人员为主。基础研究成果多强调学术价值,其绩效表现多以科学论文和学术专著为主。应用研究成果以应用前景为评价标准,绩效表现形式以技术论文、技术专著和专利为主,专利形式比论文形式更能体现其技术特征。但这并不妨碍h指数的应用,因从事技术研究开发的科学家,也有论文发表,甚至比从事基础研究的科学家还要多,且从事基础研究的科学家,同样也有专利产出等等。科学家所从事科研工作的性质通过其所在学科得以反映,因此,可以通过学科进行科研工作类型分类。
(三)学科因素对作者h指数的影响
学科间规模、发展阶段、发展速度、活跃程度等特征不同,学科间科研人论文产出及引文规律也不尽相同,甚至学科内也是如此,因此,学科间学科内研人员之间h指数也应不同。Hirsch对各个领域的科学家进行了统计分析,发各学科有成就的科学家确实有相对较高的h指数值,且各学科间h指数存在很差异。物理领域h指数最高的E.Witten,h=110;生物学家当中h指数最高SolomonH.Snyder,高达191,其次为加州理工学院生物学家David Baltimore,其h值为160。Hirsch通过测算发现生命科学领域科学家的h指数要明显高于理学领域科学家的h指数。这表明h指数像其他指标一样,不太适合直接用于科间科学家之间的比较。
各学科间科学家个人h指数的不可比性,在宏观层面上应表现为学科间h指数的差异。仿照Hirsch的定义,将学科h指数界定为“某学科的h指数是指该学科有h篇最低被引为h次的论文”。由于学科划分的相对性和层次性,同属医学一级学科的各二级学科间也应具备学科h指数的差异。通过系统分析医学一级学科的各二级学科间h指数的差异,进一步说明学科对于科研人员h指数的影响,并提出可行的校正方法,以使得学科间科研人员h指数具有可比性。
(四)自引对作者h指数的影响
h指数是基于引文分析的评价指标,基于引文分析指标多少会受到作者自引的影响。自引要分别对待恶性自引和良性自引,恶性自引近乎炫耀家底,良性自引可以见出研究的系列性、渐进性,体现学术成长历程和延续性,是正常学术规范,无可厚非。然而,当引文指标用于评价科学家个人学术成就时,类似论文作者自引部分理应排除,因自引并不能体现该文章学术影响力。自引又包括作者本人自引和合作者的引用。当然,自引会增大作者h指数,但Hirsch在文章中说作者自引对于h指数的影响很小,即使需要校正也是少数。有人分析了一组生物进化学领域科学家的h指数,发现排除自引后h指数平均降低了12.3%,信息科学高影响力科学家自引排出后h指数最多的下降了3,平均下降了0.9%或6.6%。本文则分别以国内化学部有效增选院士和ISI生物与生物化学及化学领域高被引科学家为例进一步探讨自引对于作者h指数影响,以及自引校正必要性。
四、相关的对策及建议
以上针对文献计量新指标h指数定义及评价科学家个人学术成就过程中所存在的主要影响因素进行了研究,其中包括数据库选择、作者重名、科研工作性质、学科及作者自引等问题。分析这些影响因素对于h指数影响的基础上,提出了若干修正及校正方法和建议,其中包括:
(1)针对作者重名问题对于国内科学家h指数影响,提出了组合检索策略并对作者单位组合检索进行了深入研究。针对科学家经常变迁单位问题,提出测算频繁变迁工作的科研人员的h指数时,应充分调查其工作履历,进行多机构复合检索,以便提高查全率;针对大学及机构因合并、建制、扩充等因素更换单位名称而相应数据库没有及时进行相应修改等问题,提出检索这类作者论文应格外注意,应进行单位改名前后多机构组合检索;针对机构名称变更或书写不规范等因素所引起的检索不全等问题,可通过单位邮编组合进行检索。
(2)针对科研工作性质对作者h指数的影响,理论结合检索实践对h指数适用性进行了初步分类:从事基础理论类性质研究工作的科研人员适用性较高;从事技术应用开发类性质研究工作适用性一般;从事保密性质类研究工作的科研人员基本上不适用。
(3)针对学科因素对作者h指数的影响,提出将不同学科科技人员个人的h指数进行标化后比較或分学科比较,标化方法:将科学家个人h指数除以其学科h指数,再乘上100。
(4)针对国内外作者自引比例差异,不同学科作者自引比例差异,提出用排除自引后h指数后进行评价会更准确。
然而,准确评价科学家个人学术成就是个很复杂的工程,其中除以上述涉及的问题外,还包括其年龄、从事科研时间、性别、国家语种差别、“马太效应”、论文“友情互引”及“论文反引”等问题,这些问题的存在在很大程度上限制了基于引文分析指标潜能的发挥。单纯就文献计量指标而言,h指数、论文总数、引文总数、篇均被引次数、高被引论文次数等均不同程度存在以上问题,因此,应用时均需综合全面考虑。基于以上分析,作者h指数相对较适用于国内科学精英的学术产出和学术影响力评价,且应遵守“同库同行同单位同性同年龄段相比”原则。
五、结语
评价科研人员的学术成就,仅凭其发表的论文总数并不妥,还要看这些论文的质量。但将期刊的影响因子等同论文的质量指标也是不妥的,必须具体地看其论文的情况,总体地衡量其论文的被引用情况。Hirsch提出的h指数巧妙地将数量指标(发表的论文数量)和质量指标(被引频次)结合在一起,同时对论文产出力和论文影响力进行测量,克服了以往各种单项指标的缺点与不足。尽管文献计量学家一再告诫,用文献计量学方法评价科研绩效的最小单位应该是科研小组,对科研人员个人进行绩效评价意义不大,甚至是危险的。但是,在现实的科研管理中,经常会有对个人绩效进行评价的需求,因此,不能回避这一问题,而是采取措施,不断地改进和完善个人层面的绩效评价工作。
参考文献:
[1]赵基明,邱均平,黄凯,刘兵红.一种新的科学计量指标.中国科学基金[J].2008(2).
[2]赵明基,舒明全.基于CSSCI的《中国图书馆学报》h指数及核心作者测定[J].中国图书馆学报,2008(2).
[3]刘合艳,房俊民,苑彬成.h指数研究及应用概述[J].情报理论与实践,2009(11).
(作者简介:李军(1970.6-),男,讲师,湖北国土资源职业学院工商管理系电子商务教研室。)