论文部分内容阅读
引证检索报告作为一种由引证检索机构出具的、代表专家或团队科研实力的证明材料,是科研人员或科研团队进行评职报奖以及申请基金等的重要依据。然而,在引证检索过程中,用户提供的待检索文献数据质量的好坏,直接决定了基于该数据的检索结果的准确性与可靠性,而数据检索结果的质量又影响到引证报告的权威性,即不规范的数据提供与结果处理,不仅会导致已有文献收录情况或者引用的错检与漏检,且需要经过人工反复检查来减少遗漏或修正错误,耗费大量的人力、物力和财力,鉴于此,数据质量控制在引证检索中便具有特别重要的意义,对引证检索中数据质量控制方法的研究也显得非常有必要。本文在分析引证检索人工操作流程的基础上,探讨了引证检索自动化过程中所面临的诸多数据质量问题,重点研究了引证检索自动化流程中所依赖的关键数据,即用户提供的待检文献数据和收录/引用检索的结果数据特性及其数据质量控制问题,通过建立适用于引证检索自动化过程的数据质量保障措施,从理论与实践上验证了该数据质量控制方法的独适性与高效性。主要内容包括:针对数据质量界定问题,在研究已有数据质量内涵的基础上,明确并界定了引证检索中文献数据质量的控制规约。针对引证报告自动化问题,依据引证检索中的文献数据质量控制规约,结合人工引证检索过程,设计了一套可实现引证检索自动化的检索操作流程,主要包括:收录查询的自动化,引用查询与引用文献信息获取的自动化以及报告生成的自动化。针对引证检索中数据质量的控制问题,通过分析引证检索自动化各个阶段中,可能会遇到的各种数据质量问题及其带来的影响,采取引证检索流程改进、作者提供文献列表与系统检索文献列表冗余数据监测与合并、缺失数据检测与补充、引用检索数据预处理以及待确认数据的人机交互等多种控制方法,有效保证了生成引证报告的源数据的高质量。针对数据质量控制方法的高效性问题,设计并实现了引证检索自动化软件,且对该软件整体及各个模块的应用效果,分别从整体、合并模块、错引确认模块以及自引/他引模块四个方面进行了测试,从实践上论证了文中数据质量控制方法的价值所在。针对引证检索中数据质量控制的展望与研究方向问题,文章最后给出了进一步完善和扩展引证检索中数据质量控制方法的一些想法,希望能为其它工作的自动化过程带来一些启示。