最小公共字符串划分问题的算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:chunzhu520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符串对比是计算机科学的一个基本问题,在基因组比较、文本处理与压缩等实践中有着广泛应用。近几年,最小公共字符串划分(MCSP)问题得到越来越多算法与复杂性研究者的关注。MCSP问题要求将字符串A与B划分为公共子串,使划分后A中的每一段都与B中某一段相对应,且划分得到的公共子串数目最少。在基因组比较研究中,须将两个基因组分别看作字符串,计算两个字符串的最小公共字符串划分,从而建立两个基因组中基因的对应关系。要将字符串A和B划分为公共子串,A中每个字符出现的次数必须与B中此字符的出现次数相同。如果每个输入字符串中的字符最多出现k次,就称此问题为k-最小公共字符串划分MCSP问题。2-MCSP问题已经被证明是NP-hard,并且是APX-hard。目前最好的2-MCSP问题近似算法的近似度为1.1037,3-MCSP问题的近似度为4,k-MCSP问题近似度为(?)(k)。本文首先讨论以往MCSP问题研究结果,编程实现已有的贪心算法、Novel贪心算法、Educated贪心算法以及碰集算法,并进行测试实验。在此基础上,分析评测各个算法的优缺点。然后针对k-最小公共字符串划分问题,设计实现了一个新算法:定界贪心近似算法。定界贪心算法是在碰集算法的基础上改进而成,算法具有O(k)的算法近似度以及O(n)的时间复杂度。同时大量实验数据表明,定界贪心算法与碰集算法相比具有更好的计算性能。在实际测试实验中,未曾遇到定界贪心算法性能不如碰集算法性能好的实例。最后设计实现了MCSP问题的最优解算法与随机回溯算法。令m代表输入字符串中不同元素的个数,n代表字符串的长度,最优解算法可以在O((k!)mn)的时间内计算出k-最小公共字符串划分问题的一个或者所有最优解,对评估其他近似算法的实际运行效果有着重要作用。随机回溯算法具有很高的灵活性,既可以求出最优解,也可以根据实际要求在短时间内求出较好的解,两种算法都具有较高的实用价值。最后,对最小公共字符串划分问题进行了总结与展望。本文主要创新工作为:(1)设计实现了解答最小公共字符串划分问题的新近似算法,性能好于原有近似算法。(2)设计实现了解答最小公共字符串划分问题的最优解算法和随机回溯算法,对于最优解实际求解和近似算法评测具有重要价值。
其他文献
三维激光线扫描仪能够快速测量产品原型和各种模具,方便快捷地建立三维物体的CAD模型,在数字化设计与制造,如汽车制造、运动器材、家具、文物古董和工艺品的复制、三维动画、
随着计算机科学技术和物联网不断的发展壮大,越来越多的数据以短文本的形式出现在互联网上例如新闻标题、贴吧言论、微博消息等。对短文本数据运用分类、聚类的技术,从中挖掘
基因表达数据分析是生物信息学领域中的一个非常重要的研究方向。基因表达数据不仅包含了非常多基因活跃性的信息,还反映了细胞目前生理状态。寻找基因表达之间的关联关系可
电力系统数据压缩是目前新兴的研究课题,它随着电网规模的扩大、电力信息化的发展、基于广域信息的应用而变得越来越重要。小波变换具有良好的局部特性和空间—频率特性,因而被广泛应用于电力系统数据压缩领域。但是传统小波不能同时具有对称性、正交性、短支撑性、高阶消失矩等性质,在一定程度上影响了压缩效果。多小波的出现为解决这一问题提供了一条新方案,但目前研究的多小波压缩算法只是基于阈值压缩的,压缩方法有待改进。
近些年,随着私家车数量的增加,交通拥堵问题变得越来越严重。交通部门在解决交通拥堵问题的过程中,需要对解决措施进行评价。微观交通仿真系统通过建模和推演,能够再现交通流
随着信息化的不断深入,IT技术已经渗入到企业生产运作的各个环节。工作流管理技术正是从通过提高企业整体协作效率来提高企业生产效率的角度出发,提供对业务过程中的各个活动
对于虚拟平台模拟技术来说,各种特效一直是研究和开发的热点,已经涌现了大量的研究成果,也出现了很多比较成熟的算法应用,但是单一的一种特效不足以表现整个真实世界,缺少一
近些年来,网格计算已经成为是网络计算、分布式计算以及高性能计算领域中研究的重点和热点,随着网格技术的发展和网格基础设施的不断改善,网格社区中对网格应用的需求也不断
无线通信技术的飞速发展和移动终端设备的不断更新为行业用户的工作、生活提供了无限的扩展空间。SMS是短信息服务(Short Message Service)的简称,是一种非常普及的移动数据
粗糙集是一种刻画不完整和不确定性问题的数学工具,其不需要任何先验知识对数据进行分析和处理。面对如今高速的信息时代中海量数据的形成,粗糙集在分析处理数据中发挥了重要