基于广义紧类的层级化系统演化树构造

来源 :山东大学 | 被引量 : 0次 | 上传用户:FUHENGBIN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
系统发生学是一门研究生物进化规律和物种间遗传关系的学科,利用系统演化树来描述自然界中物种之间遗传关系,得到了较为广泛的关注和研究.用图论的方法研究系统发生学的问题,一般是将生物系统抽象为有向图结构.其中,节点表示生物系统中的个体,边表示生物之间的遗传关系.使用科学分类法,将有向图中的节点进行分类,可以得到具有层次结构的演化树。  已有的多数工作,往往是针对有限图中的子集进行分类,得到具有层次化结构的演化树.然而,有限图中总有一部分节点被忽略.这造成有限图中,有大量的节点未被分类.与此同时,也有一些工作试图对无限图中的节点进行分类,然而受无限集的限制,得到的分类往往不具有理想的层次结构,其分类方法无法得到有效的应用。  本文对有限图中紧类的节点分类方法进行扩展,提出了一种能同时对有限图和无限图中进行层次化分类的方法.首先,本文在有限图中定义了广义紧类,其次,本文在广义紧类的基础上定义了广义完备紧类,即不含有边界点的广义紧类.最后,本文提出了在有限图和无限图中搜索广义紧类的方法.同时,针对大数据中广泛存在的数据缺失和噪音,对算法进行优化,提出了加权的广义紧类搜索算法,对祖先半封闭性和子图连通性进行量化,通过设定经验阈值,提高潜在的广义紧类的搜索能力.利用加权的广义紧类搜索算法,能够高效且鲁棒地处理大规模的实验数据。  针对无限图,本文通过限定物种出现的时间,对出现在时间T之前的生物个体,按照有限图的方式,定义了时间限制的广义紧类,即条件紧类.一般来说,随着限制时间的改变,条件紧类可能会出现变化,相应的其限制集也会可能会出现变化.此外,针对不随时间变化而改变的分类,本文提出了一致紧类的概念.一致紧类与时间无关,表现为稳定的分类结果,其限制集不会随时间的变化而改变.利用有限图中的广义紧类搜索算法,能够确定条件紧类和一致紧类在时间限制下的限制集,从而根据子孙封闭性,得到条件紧类和一致紧类。  相对于已有方法,本文所用方法对于分类中的节点要求更低,更容易在图中搜索出较多分类集合.同时,本文还提出了搜索分类的算法,并且能够使用GPU进行加速.此外,本文通过使用加权的分类算法,得到了更为鲁棒的分类结果。
其他文献
本文主要是对次线性期望框架下的G-正态分布及G-布朗运动进行数值模拟并对所用方法进行数值误差分析。  在金融中的风险度量以及波动率不确定性的研究中,次线性期望的概念是
库存控制自从被提出以来就受到了广大学者的关注。确定性库存下经典的EOQ模型已经不再适用于复杂多变的当今生产消费市场。社会生产力的高速发展、居民的购买力不断上涨带动
摘 要:通过对庄36井区长8储层的岩石学特征、物性特征和孔喉特征等进行了深入分析,表明:庄36井区长8储层属低孔—特低孔、特低渗—超低渗储层,岩性主要为细粒岩屑长石砂岩,发育粒间孔和溶蚀孔,孔喉结构类型属小孔隙、微细喉道型,其储层物性主要受沉积作用和成岩作用的共同影响,造成水下分流河道和河口砂坝物性明显好于河道侧翼。  关键词:鄂尔多斯盆地 庄36井区 储层  一、沉积背景  鄂尔多斯盆地是一个整
数学物理逆问题是现代数学中的一个热点研究领域,研究它的难点在于它的不适定性.在本文中,我们考虑一类经典的逆问题,即热传导问题的侧边值问题(SHE),具体的我们考虑:{uxx=ut,x≥0
全息数据存储系统很久已有大存储容量、短存取时间和高数据传输率的希望。诸如铌酸锂(LiNbO3)之类光折变材料可在适中激光功率下用于全息图记录(图1)。图1 数字全息记录光装
基因芯片可以快速检测成千上万条基因,从而对生物细胞基因水平做出一个全面的认识。近年来,越来越多学者将基因芯片技术应用到肿瘤与癌症的研究中。针对维数高、样本数量少的微
对于整数r,如下定义pr(n):  ∞∑n=0pr(n)qn=∞Πn=1(1-qn)r.研究pr(n)是有意义的.例如,当r=-1时,我们得到经典的拆分恒等式  ∞∑n=0p-1(n)qn=∞Πn1/1-qn.当r=1时,我们得到Euler
自Stefan在十九世纪末对移动边界问题开始研究以来,经过了一百多年各国学者的共同努力,已经取得了许多成果,但是它的应用潜力还是无限的,例如对新型材料的开发和研究.在本篇论文
自从1832年法拉第第一次提出了磁流体动力学(Magnetohydro Dynamic,MHD)问题以来,磁流体动力学的理论研究被国内外诸多学者所研究[1-49]。作为流体力学一个重要的分支,磁流体动