引证检索中数据质量控制研究与实现

被引量 : 0次 | 上传用户:wys9802110814
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
引证检索报告作为一种由引证检索机构出具的、代表专家或团队科研实力的证明材料,是科研人员或科研团队进行评职报奖以及申请基金等的重要依据。然而,在引证检索过程中,用户提供的待检索文献数据质量的好坏,直接决定了基于该数据的检索结果的准确性与可靠性,而数据检索结果的质量又影响到引证报告的权威性,即不规范的数据提供与结果处理,不仅会导致已有文献收录情况或者引用的错检与漏检,且需要经过人工反复检查来减少遗漏或修正错误,耗费大量的人力、物力和财力,鉴于此,数据质量控制在引证检索中便具有特别重要的意义,对引证检索中数据质量控制方法的研究也显得非常有必要。本文在分析引证检索人工操作流程的基础上,探讨了引证检索自动化过程中所面临的诸多数据质量问题,重点研究了引证检索自动化流程中所依赖的关键数据,即用户提供的待检文献数据和收录/引用检索的结果数据特性及其数据质量控制问题,通过建立适用于引证检索自动化过程的数据质量保障措施,从理论与实践上验证了该数据质量控制方法的独适性与高效性。主要内容包括:针对数据质量界定问题,在研究已有数据质量内涵的基础上,明确并界定了引证检索中文献数据质量的控制规约。针对引证报告自动化问题,依据引证检索中的文献数据质量控制规约,结合人工引证检索过程,设计了一套可实现引证检索自动化的检索操作流程,主要包括:收录查询的自动化,引用查询与引用文献信息获取的自动化以及报告生成的自动化。针对引证检索中数据质量的控制问题,通过分析引证检索自动化各个阶段中,可能会遇到的各种数据质量问题及其带来的影响,采取引证检索流程改进、作者提供文献列表与系统检索文献列表冗余数据监测与合并、缺失数据检测与补充、引用检索数据预处理以及待确认数据的人机交互等多种控制方法,有效保证了生成引证报告的源数据的高质量。针对数据质量控制方法的高效性问题,设计并实现了引证检索自动化软件,且对该软件整体及各个模块的应用效果,分别从整体、合并模块、错引确认模块以及自引/他引模块四个方面进行了测试,从实践上论证了文中数据质量控制方法的价值所在。针对引证检索中数据质量控制的展望与研究方向问题,文章最后给出了进一步完善和扩展引证检索中数据质量控制方法的一些想法,希望能为其它工作的自动化过程带来一些启示。
其他文献
文章反思山西高校科技成果转化之深层问题,认为山西高校科技成果转化不仅是山西高校自身生存与发展的需要,而且也是科技成果本身价值检验与实现的需要,对山西经济与社会发展
当前,中国城市化进程加快与城市机能衰老同时存在,由此衍生的城市问题特别是城市特色危机问题非常严峻,因此,以城市更新为契机研究城市形象问题和构建城市特色问题就显得越发
目的:降低住院患者给药差错发生率,促进患者用药安全。方法 :按品管圈理论的步骤进行计划、实施、确认和处置,分析导致住院患者给药差错发生的真因,探讨解决对策并实施,进行
随着物联网技术的快速发展和物联网应用的逐步推广,人们对智能化提出了更高的要求,智能移动视频采集作为物联网感知层的“眼睛”,迎来巨大的发展机遇。嵌入式技术与多媒体技
近年,电子商务作为一种新型的交易模式,已超越了传统的商品交易方式,并逐步被人们所接受。电子商务依托Internet这个巨大的网络平台,凭借其全球化、电子化、低成本、服务性、
癌症是世界范围内人类健康的头号杀手。目前针对癌症的治疗手段以放射治疗和化学治疗为主,虽然早期诊断及治疗水平的提高使得癌症患者的无病生存率有了很大提高,但仍面临着较高
目的:采用急诊预检分诊系统对急诊患者进行预检分诊并进行效果评价。方法:采用方便抽样法抽取2012年1、4、8月每月100名共计300名来我院急诊就诊患者作为对照组,同样方法抽取
中国行政学经过多年的建设,取得了重大成就,但同时也面临着困境:一方面,中国行政学的建设和发展在客观上存在着不少问题、不足与误区;另一方面,中国行政学的建设和发展又不可
旅游业作为服务业的一部分,是世界上最大的产业之一,并且将成为直接或间接提供就业机会的主要部门。进一步而言,据世界贸易组织(2011)预测,自2015年至2030年,新兴经济体将接
磁流变液是一种具有巨大应用前景的新型智能材料,磁流变液器件可以实现主动或半主动智能减振,解决常规方法无法完成的工程动力响应减振问题,但在重大工程中的实际应用仍然没