Levenshtein算法优化及在题库判重中的应用

来源 :华东师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:limutou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决Levenshtein距离算法在长文本和大规模匹配效率的不足,本文针对Levenshtein距离算法提出一种提前终止的优化策略.首先根据Levenshtein距离矩阵中元素内在的联系,归纳总结出一个递推关系式.再依据此递推关系式,提出一种提前终止策略,可提前判断两个文本是否满足预先设定的相似度阈值.经过多个学科题库判重实验的佐证,本文的提前终止策略能显著减少计算时间.
其他文献
数据服务的理念是大数据时代一种重要的信息服务方式.在面向服务构架(ServiceOriented Architecture,SOA)框架下研究了用于食品安全溯源系统中面向数据服务的多QoS(Quality of S
采用文献资料法,对现代足球传入中国后校园足球的发展历史进程进行梳理。认为:现代足球传入近代中国后,学校首先成为主要传播平台,并为早期中国校园足球的发展提供客观条件;
普通尼龙6具有良好的物理、机械性能,例如拉伸强度高、耐磨性优异、抗冲击韧性好、耐化学药品和耐油性突出,是五大工程塑料中应用最广的品种。但是,普通尼龙6的吸水率高,在较强外
人才地理学是人文地理学的一门新兴学科, 1986 年被我国学者提出建立,近年来在九个方面取得了较大的成果, 目前正处在形成阶段。该学科以研究人才系统与地理环境关系为主线, 以揭示人才地域分布与结构的形成和发展规律为核心,以研究区域人才资源配置和区域人才资源开发理论与技术为实践任务;由人才地理学总论研究、人才地理学理论研究和人才地理学应用研究三大块构成了学科的框架体系。
运用精细化的实分析方法,研究了Sándor-Yang平均SQA(a,b)、SAQ(a,b)与算术平均A(a,b)和二次平均Q(a,b)凸组合以及算术平均A(a,b)和反调和平均C(a,b)凸组合的序关系.得到了关于S&#225
<正> 2000年,日本的国内聚合物市场由于受到该国经济状况不佳以及市场变化无常的影响,因此并没有出现令人激动的局面。不过总的看来,国内对聚合物的需求量有了一定的提高,以P
柳树岛是松花江上的一座江心岛,位于佳木斯城中区北侧,是佳木斯市三大风景区之一。本文阐述了柳树岛的防洪工程规划方案,并对其阻洪影响进行了分析,提出了解决措施。
在聚合物纳米复合材料中,聚合物/无机纳米复合材料占据主导地位。聚合物/无机纳米复合材料的制备方法主要有溶胶一凝胶(Sol-Gel)法、插层法、混合法。由于插层法方法简单,而且制