基于分割的字符串相似性查找算法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:sunyanjun03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符串相似性查找问题主要包括两方面,基于阈值的字符串相似性查找以及top-k字符串相似性查找。目前处理基于阈值的字符串相似性查找问题的算法多是基于过滤-验证框架的。基于该框架提出了PBsearch算法,算法在过滤阶段首次加入One-Off条件过滤掉大量的无效匹配,并在验证阶段提出了一种新的验证算法MultiThreshold算法,大大减少了计算编辑距离的次数。在top-k字符串相似性查找问题方面,提出了两种基于分割思想的算法,Pb-topk算法和PbCount-topk算法。其中,Pb-topk算法采用差
其他文献
翻转课堂由"课前自主学习"和"课堂内化学习"构成其独特的教学模式,在这种教学模式下的师生关系发生了很大变化,呈现出平等的"师徒"关系、和谐的"辩友"关系以及互信的"伙伴"关系。当今教
本文利用现代新型的传感器技术,提供可靠的测试方案,研究如何较准确地测量各种类型的医用止血钳夹持力、止血夹闭合力。
随着经济全球化趋势的发展,我国加入WT0,新医改方案的出台与实施,我国医疗市场正逐步向全球开放,民营医院的竞争格局也相应发生了剧烈变化,市场营销也已悄悄地走进了各大医院
研究背景:Wnt蛋白是分泌型糖蛋白,能够激活不同的信号通路,包括经典Wnt/β-catenin信号通路,非经典的Wnt/PCP 和 Wnt/Ca2+通路。研究发现,Wnt信号通路在胚胎发生和神经系统发
针对如何客观、准确地分析和评价区域物流发展及其综合竞争力,并制定物流发展战略规划,提出了基于主成分分析的区域物流发展SWOT分析方法.首先建立评价指标体系,利用主成分分
探索了不同包装方式对榛子品质变化的影响,结果表明充氮包装保鲜效果最好。建立了充氮包装下酸价、过氧化值随贮藏温度和时间变化的动力学模型,以控制榛子在贮藏过程中的品质和
[研究背景]A群链球菌(GAS)为革兰氏阳性菌,感染人体可引起一系列轻重不等的GAS疾病。在我国,GAS感染所致的猩红热一直是《中华人民共和国传染病防治法》中规定法定报告的乙类
在经济全球化和国家间政治多边化的潮流中,国际机制已成为学术探讨和外交实践的主流,绝对国家主权话语丧失根据。作为发展中国家,为了在国家力量差距仍然严重分化的世界政治
“自然”是中国诗学的重要概念,自魏晋南北朝兴起以来,一直是中国诗学表达审美理想、阐述诗歌创作与审美问题、评价诗歌价值的重要凭藉。中国诗学的“自然”是由先秦以来道家
花生油是我国居民消费的主要植物油之一,它很容易被黄曲霉毒素B1(Aflatoxins B1,AFB1)污染。AFB1是一种毒性极强的致癌物,主要由黄曲霉或寄生曲霉产生的次生代谢产物,在泥土