论文部分内容阅读
[摘要]利用科技期刊学术不端文献检测系统(AMLC),对某医学杂志一期36篇论文进行出版后查重,61.1%的论文文字复制比小于25%,77.8%小于40%。进一步分析文字复制比大于25%的14篇论文,发现有7篇论文作者存在学术不端行为。因此,进行一次性论文查重是不够的,有必要增加论文出版前查重和出版六个月后查重,以及时发现学术不端论文并有所作为。
[关键词]学术期刊 论文 出版 查重 学术不端行为
[中图分类号]G237 [文献标识码] A [文章编号] 1009-5853 (2013) 02-0045-03
1985年美国国会颁布第一部关于科学不端行为的条例,将科学不端行为定义为伪造(fabrication)、篡改(falsification)、抄袭(plagiarism)及其他科学界所不能接受的严重行为[1]。随后人们对此现象倍加关注并展开深入探讨,把不当署名、一稿多投、一个学术成果多篇发表等行为也明确定性为科学不端行为。2010年3月24日,《中国青年报》发表记者蒋昕捷的《一起医学研究者“连环抄袭门”》的报道,提出为防止学术不端论文,有必要对已发表论文进行出版后“随访”[2]。目前,科技期刊编辑部门基本上能够做到对投稿在送审前进行论文查重,并对查重中发现的问题进行规律性分析[3-6]。考虑到查重的时滞性,有的编辑部早已实行在稿件送审前和稿件拟刊用前二次查重的制度[7-8]。但在论文发表后再行“随访”查重的鲜有报道。因此,笔者对《东南大学学报(医学版)》一期论文进行了出版后的查重研究,旨在进一步发现论文撰写中的学术不端行为并予以纠正。
1 研究对象
以2012年第1期36篇论文作为研究对象,利用科技期刊学术不端文献检测系统(AMLC)进行论文出版后的查重。按系统中文字复制比的划分标准,对文字复制比大于25%的论文,从出版前后文字复制比、前三位有重合的比对论文的文字复制比累计值、最高文字复制比论文是否为其本人、涉及论文出版时间等方面进行统计分析。
2 统计结果
所选论文已出版近三个月,文字复制比最高者达90%。61.1%的论文文字复制比小于25%,77.8%小于40%,但有7篇论文存在严重问题(具体分布见表1和表2)。文字复制比大于25%的14篇论文中,除两篇定稿前查重缺失外,其他12篇论文的文字复制比均高于出版前。有重合的比对论文前三篇累计文字复制比,基本接近或者超过所查论文的最终文字复制比。仅有3篇所检论文的最高复制比的比对论文为其所发。88.4%(99/112)有重合的比对论文没有被引用,21.4%(24/112)有重合的比对论文在2011年至2012年出版。
3 讨 论
3.1 出版后查重的必要性
在AMLC开发和被各编辑部使用前,编辑部查重使用的数据库一般为中国知网期刊全文数据库、万方数字化期刊、重庆维普的中文科技期刊数据库及题录式数据库(如医学方面的CBMdisc)等[7-8],效率较低,耗时耗力,查全率和查准率均较低,真正做到在稿件送审前和稿件拟刊用前二次查重的编辑部为数不多。随着AMLC的逐步推广和各编辑部对这项工作的重视,稿件送审前查重工作已常态化。鉴于AMLC数据库收录期刊范围、入库时滞等原因,实际文字复制比过一段时间后会有所升高。从这次对36篇已发表论文的查重结果来看,文字复制比大于51%的有7篇,其中2篇为一稿两投,3篇涉嫌抄袭,2篇属于不当引用。因此,虽然对出版后的论文进行查重属事后行为,但非常有必要,有助于编辑部主动发现并及时处理可能发生的著作权纠纷,更有效地防止学术不端行为,纠正论文发表过程中的错误,清理污染文献,使学术环境越变越好。
3.2 正确对待文字复制比
从这次研究来看,影响文字复制比的因素有五方面。一是比对数据库收录文献量。AMLC收录了期刊、学位论文、会议论文、报纸、年鉴、工具书、专利、外文文献、学术文献引文等与科学研究、学习相关的主要资源,还集成整合出版了各类第三方数据库资源,所以,使用AMLC查重有一定资源优势。但自2008年万方数据库分别获得中华医学会、中国医师协会等机构的医学期刊全文独家数据库与网络发行权以来,AMLC就不再收录这些医学期刊。因此,仅用AMLC查重,就不能与这些期刊所载论文进行比对。二是文献入库时滞。送审前的文字复制比低于定稿前和出版后,很大程度上是由文献入库时滞造成的。由表2可知,在与文字复制比大于25%的14篇论文有重合的比对论文中,有24篇发表于2011年至2012年之间。三是一稿多投。我们在对第13号论文进行比对时发现,该文参考文献中有一位作者一稿两投,而所投的另一篇文献在参考文献表中没有被著录,从而使文字复制比增加了11.5%。四是被比对论文的组成。有的论文图、表、公式等较多,如论著类;有的文字较多,如护理、教育管理、综述类等。这些都会影响对论文的判断。五是公知公认的知识。一般常识性的或者教科书上的知识,特别是概念性知识,当被作者用来阐释或讨论问题时,也会增加文字复制比。此现象在多篇论文中出现。正因为影响文字复制比的因素非常复杂,所以,编辑需要审查有重合的文字,避免误判。
3.3 查重时需注意的问题
在做查重工作时,应注意四个问题。第一,要注意交叉查重。不能只依靠AMLC,还须在万方数据知识服务平台上进行论文相似性检测,特别是医学类论文。第二,要实行在稿件送审前和稿件拟刊用前二次查重制度。经过此次出版后查重研究,我们更加认识到出版前再次查重的重要性,这样可以尽可能杜绝出版有问题的论文。第三,认真比对有重合的比对文献。对文字复制的情况要有清晰的判断,如是复制句子还是复制段落,是整句复制还是意思不变、句式改变或者同义替换。另外,对有重合的比对文献,还要与参考文献表中的文献进行分析比较,判断它们之间有无引证、抄袭、一稿多投的关系。第四,即时调整查重报告。可以删除系统给出的某些抄袭来源文献,得到新检测结果。刘清海[9]研究发现,学术不端医学论文中重复文字主要集中在方法、结果和讨论中。杨柱星等[10]对医学论文学术不端进行特点分析后发现:重合文字比例,县级论文>市级论文>省级论文,文献综述>学术论文>,护理论文>临床研究(治疗)论文;重合文字主要集中在材料与方法、讨论两部分。对于方法重合的,我们认为只要引而标注,可以删除报告中的比对文献,重新生成报告。 3.4 科学不端行为的认定
自美国国会颁布科学不端行为条例后,鉴于国会将有进一步更严厉措施,健康与人类服务部成立了科学完整性侦查办公室(OSI,在美国国立卫生研究院)和科学诚信审查协商办公室(OSIR)[11]。为维护科研诚信,我国科研管理部门已经采取种种措施[12],但工作力度还有待加强。本调查仅从文字复制比和引文角度探讨不端行为。郭玲等[13]列举了“引而不注”“著而不引”“过度他引”“不当自引”“模糊著引”五种不端行为。本次出版后查重研究结果显示,大多数有重合的比对文献没有被引用,占88.4%(99/112)。尽管存在“连环重合”的比对文献,但“引而不注”现象较为严重,而且绝大多数是他人公开发表论文(109/112)。“引而不注”是否可直接认定为抄袭?如果那些“引而不注”的文献均在参考文献表中给予标注,不管引用程度如何,是否就没有问题?这些问题都急需探讨。此外,“过度引用”如何界定?赵大良[14]在其博客中认为,对于原创性论文,过度引用是引用他人的内容已构成论文的主要或实质的部分。这里,还应包括引用自己已发表的文献,只要剔除引用部分就不能构成可发表的最小单元,均可认定为过度引用。张小强等[15]认为,从学术伦理以及学术期刊办刊规律来看,应将在网络上公开发布过的学位论文再次发表视为学术不端。总之,编辑可对学术不端论文提出疑议,可作撤稿声明处理,但真正进行学术行为定性时,应由专门的学术机构或者学术道德委员会来认定。
4 结 语
本次调查是仅针对一期发表的论文进行的,因栏目下文献数量有限,还不能反映文字复制比在期刊栏目上的分布规律,今后有必要在此方面进行探讨。郑雨田[16]认为,将文字复制比20%定为须仔细分析比对文献的界限。结合本调查,我们认为有必要将可发表文章的容忍度降低,即文字复制比调至25%,高于25%的要慎用。文字复制比的界值只是经验值,不同类型的文章会有所不同。在进行查重时,要充分考虑多种影响因素,不能过分依赖报告。对查重报告必须进行人为识别。尽量多角度、多系统、多手段、多时段地进行论文查重,科学地对待查重结果,有必要对已发表论文进行“随访”,对学术不端论文要有所作为。
注 释
[1][11]Rennie D.Gunsalus C. K.Scientific misconduct:new definition, procedures, and office-perhaps a new leaf[J].JAMA, 1993,269(7):915-917. doi:10.1001/jama.1993.03500070095037.
[2]张儒祥,丁茂平.医学期刊责任编辑在防止学术不端论文出版中的作为[J].编辑学报,2010,22(6):519-521
[3]姜春霞.《郑州大学学报(医学版)》稿件学术不端检测情况[J].辽宁师专学报,2011,13(1):106-107
[4][12]陈素军,徐文娟.科技期刊出版过程中不端行为的防范[J].中国科技期刊研究,2011,22(5),693-696
[5][10]杨柱星,林荣慧,胡榜利,等.医学论文学术不端的特点及判定[J].中国科技期刊研究,2011,22(5),697-701
[6]陆宜新.学术期刊不端文献检测结果的统计分析[J].中国科技期刊研究,2011,22(5):701-703
[7]冷怀明.避免科技论文重复发表和一稿多投的机制与实践[J].编辑学报,2007,19(6):457-458
[8]栾嘉,刘洪娥,王红.《第三军医大学学报》拟刊用稿件查重结果分析[J].编辑学报,2008,20(1):52-53
[9]刘清海.学术不端医学论文中重复文字的分布[J].编辑学报,2010,22(5):447-449
[13]郭玲,陈燕.参考文献著录中的学术道德缺失现象及其防范[J].编辑学报,2007,19(1):8210
[14]赵大良.学术不端界定研讨随笔[Z/OL].[2012-10-01].http://zhaodal.blog.163.com/blog/static/558384201242042532653/
[15]张小强,赵大良.学位论文再次发表的版权与学术不端问题分析[J].编辑学报,2011,23(5):377-379
[16]郑雨田.未发表文章与已发表文章内容重合度分析:以医学文章为例[J].中国科技期刊研究,2011,22(6):894-897
(收稿日期:2012-10-09)
[关键词]学术期刊 论文 出版 查重 学术不端行为
[中图分类号]G237 [文献标识码] A [文章编号] 1009-5853 (2013) 02-0045-03
1985年美国国会颁布第一部关于科学不端行为的条例,将科学不端行为定义为伪造(fabrication)、篡改(falsification)、抄袭(plagiarism)及其他科学界所不能接受的严重行为[1]。随后人们对此现象倍加关注并展开深入探讨,把不当署名、一稿多投、一个学术成果多篇发表等行为也明确定性为科学不端行为。2010年3月24日,《中国青年报》发表记者蒋昕捷的《一起医学研究者“连环抄袭门”》的报道,提出为防止学术不端论文,有必要对已发表论文进行出版后“随访”[2]。目前,科技期刊编辑部门基本上能够做到对投稿在送审前进行论文查重,并对查重中发现的问题进行规律性分析[3-6]。考虑到查重的时滞性,有的编辑部早已实行在稿件送审前和稿件拟刊用前二次查重的制度[7-8]。但在论文发表后再行“随访”查重的鲜有报道。因此,笔者对《东南大学学报(医学版)》一期论文进行了出版后的查重研究,旨在进一步发现论文撰写中的学术不端行为并予以纠正。
1 研究对象
以2012年第1期36篇论文作为研究对象,利用科技期刊学术不端文献检测系统(AMLC)进行论文出版后的查重。按系统中文字复制比的划分标准,对文字复制比大于25%的论文,从出版前后文字复制比、前三位有重合的比对论文的文字复制比累计值、最高文字复制比论文是否为其本人、涉及论文出版时间等方面进行统计分析。
2 统计结果
所选论文已出版近三个月,文字复制比最高者达90%。61.1%的论文文字复制比小于25%,77.8%小于40%,但有7篇论文存在严重问题(具体分布见表1和表2)。文字复制比大于25%的14篇论文中,除两篇定稿前查重缺失外,其他12篇论文的文字复制比均高于出版前。有重合的比对论文前三篇累计文字复制比,基本接近或者超过所查论文的最终文字复制比。仅有3篇所检论文的最高复制比的比对论文为其所发。88.4%(99/112)有重合的比对论文没有被引用,21.4%(24/112)有重合的比对论文在2011年至2012年出版。
3 讨 论
3.1 出版后查重的必要性
在AMLC开发和被各编辑部使用前,编辑部查重使用的数据库一般为中国知网期刊全文数据库、万方数字化期刊、重庆维普的中文科技期刊数据库及题录式数据库(如医学方面的CBMdisc)等[7-8],效率较低,耗时耗力,查全率和查准率均较低,真正做到在稿件送审前和稿件拟刊用前二次查重的编辑部为数不多。随着AMLC的逐步推广和各编辑部对这项工作的重视,稿件送审前查重工作已常态化。鉴于AMLC数据库收录期刊范围、入库时滞等原因,实际文字复制比过一段时间后会有所升高。从这次对36篇已发表论文的查重结果来看,文字复制比大于51%的有7篇,其中2篇为一稿两投,3篇涉嫌抄袭,2篇属于不当引用。因此,虽然对出版后的论文进行查重属事后行为,但非常有必要,有助于编辑部主动发现并及时处理可能发生的著作权纠纷,更有效地防止学术不端行为,纠正论文发表过程中的错误,清理污染文献,使学术环境越变越好。
3.2 正确对待文字复制比
从这次研究来看,影响文字复制比的因素有五方面。一是比对数据库收录文献量。AMLC收录了期刊、学位论文、会议论文、报纸、年鉴、工具书、专利、外文文献、学术文献引文等与科学研究、学习相关的主要资源,还集成整合出版了各类第三方数据库资源,所以,使用AMLC查重有一定资源优势。但自2008年万方数据库分别获得中华医学会、中国医师协会等机构的医学期刊全文独家数据库与网络发行权以来,AMLC就不再收录这些医学期刊。因此,仅用AMLC查重,就不能与这些期刊所载论文进行比对。二是文献入库时滞。送审前的文字复制比低于定稿前和出版后,很大程度上是由文献入库时滞造成的。由表2可知,在与文字复制比大于25%的14篇论文有重合的比对论文中,有24篇发表于2011年至2012年之间。三是一稿多投。我们在对第13号论文进行比对时发现,该文参考文献中有一位作者一稿两投,而所投的另一篇文献在参考文献表中没有被著录,从而使文字复制比增加了11.5%。四是被比对论文的组成。有的论文图、表、公式等较多,如论著类;有的文字较多,如护理、教育管理、综述类等。这些都会影响对论文的判断。五是公知公认的知识。一般常识性的或者教科书上的知识,特别是概念性知识,当被作者用来阐释或讨论问题时,也会增加文字复制比。此现象在多篇论文中出现。正因为影响文字复制比的因素非常复杂,所以,编辑需要审查有重合的文字,避免误判。
3.3 查重时需注意的问题
在做查重工作时,应注意四个问题。第一,要注意交叉查重。不能只依靠AMLC,还须在万方数据知识服务平台上进行论文相似性检测,特别是医学类论文。第二,要实行在稿件送审前和稿件拟刊用前二次查重制度。经过此次出版后查重研究,我们更加认识到出版前再次查重的重要性,这样可以尽可能杜绝出版有问题的论文。第三,认真比对有重合的比对文献。对文字复制的情况要有清晰的判断,如是复制句子还是复制段落,是整句复制还是意思不变、句式改变或者同义替换。另外,对有重合的比对文献,还要与参考文献表中的文献进行分析比较,判断它们之间有无引证、抄袭、一稿多投的关系。第四,即时调整查重报告。可以删除系统给出的某些抄袭来源文献,得到新检测结果。刘清海[9]研究发现,学术不端医学论文中重复文字主要集中在方法、结果和讨论中。杨柱星等[10]对医学论文学术不端进行特点分析后发现:重合文字比例,县级论文>市级论文>省级论文,文献综述>学术论文>,护理论文>临床研究(治疗)论文;重合文字主要集中在材料与方法、讨论两部分。对于方法重合的,我们认为只要引而标注,可以删除报告中的比对文献,重新生成报告。 3.4 科学不端行为的认定
自美国国会颁布科学不端行为条例后,鉴于国会将有进一步更严厉措施,健康与人类服务部成立了科学完整性侦查办公室(OSI,在美国国立卫生研究院)和科学诚信审查协商办公室(OSIR)[11]。为维护科研诚信,我国科研管理部门已经采取种种措施[12],但工作力度还有待加强。本调查仅从文字复制比和引文角度探讨不端行为。郭玲等[13]列举了“引而不注”“著而不引”“过度他引”“不当自引”“模糊著引”五种不端行为。本次出版后查重研究结果显示,大多数有重合的比对文献没有被引用,占88.4%(99/112)。尽管存在“连环重合”的比对文献,但“引而不注”现象较为严重,而且绝大多数是他人公开发表论文(109/112)。“引而不注”是否可直接认定为抄袭?如果那些“引而不注”的文献均在参考文献表中给予标注,不管引用程度如何,是否就没有问题?这些问题都急需探讨。此外,“过度引用”如何界定?赵大良[14]在其博客中认为,对于原创性论文,过度引用是引用他人的内容已构成论文的主要或实质的部分。这里,还应包括引用自己已发表的文献,只要剔除引用部分就不能构成可发表的最小单元,均可认定为过度引用。张小强等[15]认为,从学术伦理以及学术期刊办刊规律来看,应将在网络上公开发布过的学位论文再次发表视为学术不端。总之,编辑可对学术不端论文提出疑议,可作撤稿声明处理,但真正进行学术行为定性时,应由专门的学术机构或者学术道德委员会来认定。
4 结 语
本次调查是仅针对一期发表的论文进行的,因栏目下文献数量有限,还不能反映文字复制比在期刊栏目上的分布规律,今后有必要在此方面进行探讨。郑雨田[16]认为,将文字复制比20%定为须仔细分析比对文献的界限。结合本调查,我们认为有必要将可发表文章的容忍度降低,即文字复制比调至25%,高于25%的要慎用。文字复制比的界值只是经验值,不同类型的文章会有所不同。在进行查重时,要充分考虑多种影响因素,不能过分依赖报告。对查重报告必须进行人为识别。尽量多角度、多系统、多手段、多时段地进行论文查重,科学地对待查重结果,有必要对已发表论文进行“随访”,对学术不端论文要有所作为。
注 释
[1][11]Rennie D.Gunsalus C. K.Scientific misconduct:new definition, procedures, and office-perhaps a new leaf[J].JAMA, 1993,269(7):915-917. doi:10.1001/jama.1993.03500070095037.
[2]张儒祥,丁茂平.医学期刊责任编辑在防止学术不端论文出版中的作为[J].编辑学报,2010,22(6):519-521
[3]姜春霞.《郑州大学学报(医学版)》稿件学术不端检测情况[J].辽宁师专学报,2011,13(1):106-107
[4][12]陈素军,徐文娟.科技期刊出版过程中不端行为的防范[J].中国科技期刊研究,2011,22(5),693-696
[5][10]杨柱星,林荣慧,胡榜利,等.医学论文学术不端的特点及判定[J].中国科技期刊研究,2011,22(5),697-701
[6]陆宜新.学术期刊不端文献检测结果的统计分析[J].中国科技期刊研究,2011,22(5):701-703
[7]冷怀明.避免科技论文重复发表和一稿多投的机制与实践[J].编辑学报,2007,19(6):457-458
[8]栾嘉,刘洪娥,王红.《第三军医大学学报》拟刊用稿件查重结果分析[J].编辑学报,2008,20(1):52-53
[9]刘清海.学术不端医学论文中重复文字的分布[J].编辑学报,2010,22(5):447-449
[13]郭玲,陈燕.参考文献著录中的学术道德缺失现象及其防范[J].编辑学报,2007,19(1):8210
[14]赵大良.学术不端界定研讨随笔[Z/OL].[2012-10-01].http://zhaodal.blog.163.com/blog/static/558384201242042532653/
[15]张小强,赵大良.学位论文再次发表的版权与学术不端问题分析[J].编辑学报,2011,23(5):377-379
[16]郑雨田.未发表文章与已发表文章内容重合度分析:以医学文章为例[J].中国科技期刊研究,2011,22(6):894-897
(收稿日期:2012-10-09)