同源DNA序列中间隔位点的缺失数据处理研究

来源 :福建农林大学 | 被引量 : 0次 | 上传用户:jingcheng0417
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分子系统发育分析是生物信息学的一个重要研究领域,系统发育树的推算可以重建祖先序列,估计现存生物的演化关系和分歧时间。序列比对是系统发育研究的第一步,序列比对后产生的间隔位点被理解为序列从共同祖先分歧时发生插入/缺失事件的位点。同源DNA多序列比对后的间隔代表这种特殊的DNA突变事件,在系统发育树重建过程中采用删除和忽略间隔位点的处理方法可能丢失间隔所包含的系统发育信息。为在分子系统发育分析中有效地融合间隔位点所携带的进化信息,与将间隔视为第5种状态的DNA进化马尔可夫模型的方法及其它特殊的编码方法不同,本文借鉴统计学中缺失数据的处理方法,分别提出以最近邻法和最大似然法选择合适的核苷酸插补间隔位点,对插补后序列再运用4-状态DNA进化马尔可夫模型估算序列间进化距离或重建系统发育树的方法。主要完成了下列研究,形成如下结论:1、针对忽略间隔位点可能造成同源序列间进化距离的偏低估计问题,本文依据最小进化原理,分别首次提出时间复杂度为O(ms)的核苷酸最近邻插补算法和时间复杂度为O(4,m-1s)的核苷酸最大似然法插补算法,用于替换同源DNA序列比对后产生的间隔。2、为分析核苷酸插补后对于同源DNA序列间分歧度估算产生的影响,通过对3组真实DNA序列在不同间隔处理方法下的距离估算进行对照测试,结果表明:5-状态的F81+gap和F84+gap模型不能有效融合间隔所携带的indel信息,反而更加低估序列间距离,改进的5-状态模型F81+gap’能在一定程度上减少序列间距离的偏低估计。本文提出的核苷酸最近邻插补处理方法和最大似然法插补处理方法均可以在一定程度上减少序列间距离的偏低估计,且两种插补处理方法下的进化距离估算仅存在细微差别。3、为评估核苷酸插补后对于系统发育重建中进化树拓扑和枝长估算的效应,通过对重复模拟DNA进化产生的30组虚拟同源DNA序列数据集,在不同间隔处理方法下采用4-状态的K80模型和最大似然法进行系统发育树的重建推算,对照分析表明:本文提出的核苷酸最近邻插补方法和最大似然法插补方法与传统的删除忽略间隔位点处理方法重建的分子系统发育树拓扑是一致的,符合本文提出的假设。而在进化树分枝长度估算的误差方面,本文所提出的两种核苷酸插补处理方法均小于传统的直接删除忽略间隔位点的方法。结论:本文提出的核苷酸最近邻插补处理方法和最大似然法插补处理方法能够融合DNA突变中的indel信息,减少序列间距离的偏低估计,减少系统发育树分枝长度的偏低估计,在一定程度上提高分子系统发育重建的精确度。
其他文献
建立校内生产性实训基地是高职会计专业完善职业教育和培训体系,深化产教融合、校企合作的重要方式。目前,我国高职会计专业的校内生产性实训基地建设尚处在起步阶段,还没有
利息率对交易性货币需求的影响要在人们收入水平越过温饱线之后才产生,文章使用笔者修正后的交易性货币需求模型,运用回归分析的方法对我国转型期的交易性货币需求的决定进行
民国初年,镇守使的设置本为临时举措,但《镇守使署暂行条例》对军事兼管民政等事务的规定为镇守使的日后地方割据提供了某种契机。察哈尔、热河地区各镇守使长官基本由中央任
行业专长是会计师事务所专业技能的重要组成部分。本文为了验证会计师事务所行业专长对审计费用的影响,把行业专长细分为一般行业专长和熟练行业专长,采用多元回归方法,运用2003
私人影院如今的发展势头很好。但从法律角度来看,还有很多问题需要探讨。只有在法律上打好基础、做好应对,私人影院才能走得更远。$$牘牘私人影院的兴起,对于想开电影院的人来说
报纸
将多壁碳纳米管填充在粉末微电极尖端的小孔里制成碳纳米管粉末微电极,研究氧单电子还原产生超氧自由基的电化学行为.在二甲亚砜(DMSO)介质中,该电极反应是一个近乎可逆的还彤氧化
【现象】国际知名的《科学》杂志近期刊文,披露了一项关于人类睡眠的最新研究成果。研究表明,当人类睡着后,血液会周期性地流出大脑,脑脊液随即进入,对大脑里β淀粉样蛋白等代谢副
报纸
当前医药板块的低配水平与行业基本面转暖、整合提效加速的趋势不相匹配,这主要与市场对于短期业绩波动和整合兑现的过度担忧,但我们判断医改政策导向不变,行业长期趋势不改,医药
报纸
将数学建模思想融入大学数学教学内容之中,能够有效地培养大学生运用数学知识解决实际问题的能力.本文探讨了将数学建模思想融入大学数学教学内容之中应遵循的目标和原则,并介
组合测试是实现高覆盖率测试的有效方法,因其能极大提高测试效率,已成功的应用到软件测试领域中。组合测试技术不仅研究如何生成规模小的测试用例集来覆盖尽量多的故障模式,