一种有效检测汉语相似重复记录的方法

来源 :科技情报开发与经济 | 被引量 : 0次 | 上传用户:sufe_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从排序属性的选择、匹配方法、相似度计算、检测和处理相似重复记录以及实验结果几个方面,阐述了一种有效检测汉语相似重复记录的方法。
其他文献
在当前的图书采访模式下,"时间差"问题是最突出、最迫切需要解决的问题。就当前主要的采访模式进行了阐述,分析了"时间差"问题出现的原因,并根据工作经验提出了解决"时间差"问题的
介绍了在汇文系统下如何利用条码采集器进行馆藏清查工作,并与直接利用汇文系统典藏模块的馆藏清查工作做了对比,总结了该方法的优点。
南阳师范学院图书馆以馆藏资源为基础,以"绿茵读书会"为平台,以"4.23读书日"为契机,积极开展全民阅读活动,探索出了一整套切实可行的读书活动实践模式,在优化读书治学环境、推进
介绍了K18DG型煤炭漏斗车入厂检修的工艺过程,以及车辆在满足现有技术条件下进行改造的过程。根据K18DG型煤炭漏斗车的结构特点,将车辆通用部分(车辆转向架、车钩缓冲装置)的检
针对当前研究生培养工作的相关变化,分析了文献检索课程教学中存在的问题,对课程的教学内容和教学方式进行了调整。
在Web2.0时代,网络舆论紧扣社会事件和公众热点,对社会生活和人们尤其是青年的思想产生了深刻影响。着重分析了网络舆论对青年的双重影响,并针对这些现象提出了若干对策。
阐述了信息生态的相关内容,分析了企业信息生态所面临的各种问题。通过剖析知识管理及其倡导的理念,指出企业通过实施有效的知识管理,可以很好地解决信息生态系统所面临的问题。
介绍了水泥稳定碎石底基层的施工准备和施工材料,对拌和、运输、摊铺、碾压、养生等施工过程进行了详细的说明,提出了确保工程质量的具体措施。
介绍了焦炉自动化生产系统的构成及其原理,探讨了无线音视频技术在焦炉自动化生产四大车连锁中的辅助应用。