【摘 要】
:
古生物进化树的构建是探索早期生命起源和进化发展规律的重要途径。对于古生物进化树的构建而言,采集于化石的表征数据是可以依据的主要材料。然而古生物表征数据中存在的缺失值和不适用状态,往往导致古生物进化树难以有效构建。针对上述问题,本文从古生物表征数据的特点出发,通过融入演化分析中的先验知识,提出了一种基于层次推断和简约聚类的古生物进化树构建方法。具体研究内容如下:(1)根据表征数据的特征之间存在逻辑关
论文部分内容阅读
古生物进化树的构建是探索早期生命起源和进化发展规律的重要途径。对于古生物进化树的构建而言,采集于化石的表征数据是可以依据的主要材料。然而古生物表征数据中存在的缺失值和不适用状态,往往导致古生物进化树难以有效构建。针对上述问题,本文从古生物表征数据的特点出发,通过融入演化分析中的先验知识,提出了一种基于层次推断和简约聚类的古生物进化树构建方法。具体研究内容如下:(1)根据表征数据的特征之间存在逻辑关联的特点,建立特征层次结构模型,进而提出了一种基于层次推断的表征数据中缺失值的填补方法。首先,基于特征层次模型提出了一种层次推断框架,并将距离加权的K近邻法引入该框架填补缺失值。实验表明,上述方法在多个缺失比例下优于模糊优化方法。(2)针对不适用状态导致进化树难以稳定构建的问题,提出了一种基于简约聚类的含不适用状态的进化树构建与优化方法,包括进化树的构建和最优树的搜索两个阶段。在进化树的构建过程中,将特征层次结构模型和特征极向等先验知识融入聚类算法,提出一种简约聚类方法用以构建含不适用状态的进化树。在最优树的搜索阶段,在简约原则的基础上采用模拟退火算法进行启发式地搜索。多个含不适用状态的表征数据上的实验表明,相较于现有处理不适用状态的方法,上述方法构建的进化树与模板树之间的Robinson-Foulds距离平均减少了0.125左右。(3)通过分析古生物表征数据中缺失值的缺失机制和不适用状态,在(2)与(3)的基础上,提出了一种基于层次推断和简约聚类的古生物进化树构建方法。该方法首先结合距离加权的K近邻法和层次推断框架以填补古生物表征数据中的缺失值,在数据可解释的前提下降低数据的模糊性。然后,采用(2)中的方法构建并优化含不适用状态的古生物进化树。实验表明,基于上述方法构建的古生物进化树,与目前普遍认可的进化树的拓扑结构基本一致,验证了该方法在含缺失值和不适用状态的古生物进化树构建方面的有效性。综上所述,本文提出的方法更适合构建含缺失值和不适用状态的古生物进化树的构建,可以为古生物学家为探索生命起源提供了更多的论证资料。
其他文献
本篇报告以《解密乔姆斯基:科学和变革性政治》的汉译为基础,这本书以新颖而令人信服的方式将乔姆斯基的科学与其政治联系在一起。该书的作者从社会人类学家的角度,在乔姆斯
ER+乳腺癌产生他莫昔芬耐药是乳腺癌治疗的重要挑战之一。有氧糖酵解是癌细胞中葡萄糖代谢的主要特征,有研究报道有氧糖酵解与肿瘤化疗药物耐药性相关,然而目前尚不清楚ER+乳
本翻译实践报告是基于对《百年战争史》(England and the Hundred Years’War)一书的翻译。原文为历史类文本,包含着大量的历史背景知识,所描写的百年战争期间,国家间政治、
土壤CO2浓度与土壤呼吸密切相关,地表CO2排放强烈依赖于土壤CO2浓度积累和分布。喀斯特(Karst,岩溶)土壤被认为是喀斯特空气和喀斯特洞穴中CO2的主要来源;在喀斯特区,土壤层是
背景:乳腺癌是我国女性最常见恶性肿瘤,主要治疗手段是通过手术切除肿瘤组织。肿瘤术后生存率的影响因素除肿瘤标志物水平、临床分期、病理分级、残余病灶大小、淋巴结转移及
计算机多阶段自适应测验(MST)结合了纸笔测验(P&P)和计算机自适应测验(CAT)两者的优势,MST既有自适应的优势又可以帮助测验开发者更好的管理测验并保持测验平行。认知诊断(CD
代际问题是每个个体都要面对的具体问题,因此探讨代际关系的艺术作品更具有“及物”的具体性,尤其在“后喻文化”的今天,对于代际问题的探讨已十分复杂和迫切。本文整理了探
多药耐药(MDR)是癌症对化疗药物产生耐药性的主要原因,也是临床成功治疗各种癌症的主要障碍之一。具有较高比表面积介孔纳米颗粒的应用为化学治疗药物的输送提供了新的解决思路
目的:评估椎间盘内电热疗法(Intradiscal electrothermal therapy,IDET)和椎间盘镜椎间盘髓核摘除术(Microendoscopic discectomy,MED)/椎间融合术治疗椎间盘源性下腰痛的疗
在日常生活和机构性话语中,身份与我们每个人息息相关。交际过程中,人们通常会以不同的身份进行交流,建构适当的身份有助于交际目的的实现。本研究在维索尔伦的顺应论视角下,