高效的top-k相似字符串查询算法

来源 :通信学报 | 被引量 : 2次 | 上传用户：dongnoh

【摘要】

：

研究基于编辑距离的top-k相似字符串查询处理方法,即对于给定的字符串集合S和查询串σ,返回S中前k个与σ编辑距离最小的字符串。首先提出了基于长度跳跃索引的2种自适应过滤策略来减少字符串之间编辑距离的计算次数;其次提出了查询字符串与不匹配字符串集合的编辑距离下界,以便在处理和σ无公共特征的字符串时,进一步减少编辑距离的计算次数;最后给出了基于上述过滤策略的高效top-k相似字符串查询算法,并在3个

【作者】

：

陈子阳韩玉俊王璿周军锋

【机构】

：

燕山大学信息科学与工程学院,河北省计算机虚拟技术与系统集成重点实验室

【出处】

：

通信学报

【发表日期】

：

2014年12期

【关键词】

：

字符串相似性非对称特征方案长度跳跃索引 string similarity asymmetric signature scheme length-skip

【基金项目】

：

国家自然科学基金资助项目（61040023,61272124,61303040）, 河北省教育厅研究计划基金资助项目（Y2012014）, 河北省科学技术研究与发展计划科技支撑计划基金资助项目（11213578）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

中兴通讯纯利大幅倒退一半海外增收不增利

2006年8月29日消息，在中兴通讯2006年上半年业绩发布会上，面对净利润大幅倒退46％的成绩单．殷一民的牙关仍咬得很紧：“在一个高速增长的市场里，多投入一些资金．我觉得是正常的”令年

期刊

中兴通讯增收海外发布会营业额同期

基于参数-值替换的错误定位方法

现有错误定位方法难以检测程序遗漏错误,提出一种方法层次的基于参数-值替换的错误定位方法。首先将出现在失败执行中的方法作为可疑方法候选集,计算该集合中元素对程序执行结果的影响度,再利用值替换技术计算高影响度方法的兴趣参数-值映射对,然后依据方法是否包含兴趣参数-值映射对对候选集中方法进行分类,并依据其影响度分别进行排序,最后生成一个可疑方法序列进行错误定位。实验结果表明该方法较其他错误定位方法具有更

期刊

错误定位遗漏错误值替换兴趣参数-值映射对fault localization omission error value replacement inte

穴位注射治疗妊娠反应38例

自1993年以来,笔者运用维生素B1翳风穴位注射治疗妊娠反应,疗效肯定,无不良反应 ,现报道如下.

期刊

穴位注射治疗妊娠反应

中医辨证治疗低热

期刊

辨证论治低热中医药疗法

认知mesh网络服务区分的动态频谱接入策略

动态频谱接入策略是实现认知无线电网络高效利用频谱的关键。与传统认知无线电网络不同,认知mesh网络中不同QoS需求的多类型业务共同接入,为适应这一特点,提出服务区分的动态频谱接入策略。策略依据业务的QoS需求确立优先级,针对不同优先级业务采取不同的信道接入方案,实时业务依据最优传输延迟期望选择接入信道集合,在减小传输延迟的同时降低数据传输过程授权用户出现的概率,普通业务选择最优理想传输成功概率的信

期刊

认知mesh网络动态频谱接入服务区分cognitive wireless mesh network dynamic spectrum access dif

论建筑企业的经营管理与可持续发展的理念

随着我国深化经济体制的改革,社会的各个行业将向一个崭新的平台发展,其中包含着建筑工程行业.目前,我国积极发挥市场在资源配置中的基础性作用,使得本行业的竞争愈发激烈.因

期刊

建筑企业经营管理可持续发展

努力走在建筑节能的前列

1建筑节能,着力技术创新安徽建工集团在2005年前后就开始着力建筑节能,以技术研究为先导,以施工检验为手段,探究建筑节能的方式与措施,2006年7月,安徽建工集团就被建设部评为

期刊

建筑节能技术创新施工检验先进集体科技进步建设部安徽

70亿豪夺再曝电信业乱收费

客服投诉机制形同虚设。投诉不过是浪费时间。徒生肝火；诉讼维权机制偏袒垄断。劳民伤财。往往无果而终；面对垄断巨头，法院也缩手缩脚。以回避之虚行偏袒之实，电信运营商黑吃，黑拿

期刊

乱收费电信业电信运营商机制投诉垄断浪费

基于身份的多接收者匿名签密改进方案

对庞等提出的首个考虑发送者和接收者双重匿名性的基于身份的多接收者匿名签密方案进行安全性分析,结果表明该方案不满足选择密文攻击下的密文不可区分性,在现有安全模型下,攻击者可以区分不同消息的签密密文。提出一个在随机预言模型下选定身份安全的改进方案,新方案在CDH和Gap-BDH困难问题假设下分别满足密文的存在不可伪造性和不可区分性。

期刊

匿名性多接收者签密基于身份签密随机预言anonymity multi-receivers signcryption identity based sig

无线ad hoc网络多性能指标基本性能边界

在无线ad hoc网络中,基本性能边界对路由算法和资源分配协议的分析和评价具有重要的意义。对无线ad hoc网络多性能指标基本性能边界进行了研究,包括理论上最优的性能边界和实

期刊

基本性能边界性能评价多目标优化无线ADHOC网络fundamental performance bounds performance evaluati

高效的top-k相似字符串查询算法

与本文相关的学术论文