基于编辑距离的序列聚类算法的优化

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:happy_hoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
摘摇要:现有的很多序列聚类算法都是基于“局部特征可以代表整个序列冶的假设,在实际应用中不对序列局部相似性和全局相似性加以区分,这对于存在子模式的序列聚类是适用的,如基因序列和蛋白质序列.但是对于不存在子模式的序列,如对临床行为序列、用户购买行为序列进行聚类时,用基于全局相似性度量的聚类方法更为恰当.针对不存在子模式的序列聚类的需要,采用编辑距离作为序列相似性计算方法,在二分K均值算法的基础上,提出了利用编辑距离上下界以及通过前缀子序列进行剪枝的序列聚类算法PSClu.该算法能有效过滤编辑距离的计算量.实验
其他文献
现如今互联网购物成为一种主要的购物方式,而各个购物平台都面临商品数据过量的问题,如何尽快地给出用户需求的商品列表就成为亟待解决的问题。基于约束的推荐系统不依赖用户
目的研究对比对第二产程异常产妇实施产钳助产和急诊剖宫产处理措施对母婴结局的影响。方法选取2017年3月至2017年12月期间,我院接收诊治的第二产程异常产妇100例作为研究样
OSPF路由欺骗对OSPF路由协议构成严重的安全威胁,目前还没有全面有效的攻击检测和防御方法。文中首先分析比较了目前主要的OSPF路由欺骗攻击,将攻击分为引起反击和不引起反击
目的:观察普米克令舒用于小儿哮喘急性发作临床治疗中的有效性。方法:从2017年3月至2019年3月在我院接受治疗的小儿哮喘急性发作患儿中抽取100例作为研究对象,随机对其进行分
目的:评价自然干燥法在新生儿脐带护理中的应用效果.方法:按照数字随机分组原则将在我科收治的136例新生儿分为观察组与对照组,每组各68例.对照组新生儿给予常规脐带护理,观
目的:分析在甲状腺术中实施个性化护理的效果.方法:选取62例进行甲状腺手术患者为本次研究对象,按照不同护理方法,分为实验1组与实验2组,每组31例.实验1组实施常规性措施,实
目的:研究扩大切除手术及肿物单纯切除两种治疗方法在肉芽肿性小叶性乳腺炎治疗中的效果。方法:选取2017年12月-2018年12月医院收治的肉芽肿性小叶性乳腺炎患者40例,随机分为