聚类技术在大样本序列进化树分析中的应用

来源 :中国卫生统计 | 被引量 : 0次 | 上传用户:SBRBWD0801
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的进化树分析是生物信息学研究的重要工具,但是目前结果比较精确的进化树方法计算量都很大,无法在大样本数据中直接应用。本文试图通过结合聚类分析和进化树分析的方法以解决此问题。方法以甲型流感病毒的H3A1序列为例,首先使用两步聚类将数据进行拆分,随后按照类别分类构建进化树,并最终将其拼接为完整的进化树结果。结果序列的聚类结果与进化树结构间呈现出高度的一致性,各类别在时间上的更替规律在进化树中则呈现为各进化树节段的交替。结论聚类方法与进化树方法相结合可以很好地满足大样本序列的进化树分析需求,如果在模型中加入其他参数,还可以使结果更为丰富,值得在该领域中推广。
其他文献
以速生小白菜品种"快菜30"为试材,对小白菜的株高、叶片数、最大叶长、最大叶宽、单株地上部干鲜重、单株地下部干鲜重等指标进行观测,并对结果进行Logistic生长曲线方程拟合
机械构件的疲劳裂纹的扩展行为往往表现出阶段性,疲劳失效作为一个系统耗散过程,在不同的扩展阶段内必然隐含着一些内部模式的演变,如果建立一种相对初始状态模式的异常测度
经口插管和气管切开术是临床常见的急救手术,此方法可以快速有效的重建呼吸通道。置入带有套囊的气管套管,给套囊内注入一定量的气体,不仅可以为实施控制呼吸或辅助呼吸时提
以沙田柚自交和异交花柱为试材,采用高通量测序技术对其进行转录组测序。通过差异分析得到RNase-like贮藏蛋白的基因序列,并研究了其理化性质。结果表明:该基因全长1 048bp(G
近年来,我国的房地产业迅速发展,房产税税收收入迅速发展并在税收收入中占据了重要的地位和作用,但我国房地产税制并未得到调整和改良,房产税的征收未达到预期征收的目的和效
为了了解铸造行业职业病危害因素分析与防治,通过对福建省内铸造行业的实际生产情况和职业卫生调查,该行业的工作场所中产生的职业病危害因素为粉尘、高温及热辐射、振动、噪
既往一个世纪中,发展中国家和发达国家工业化和城市化进程迅猛,人民生活水平显著改善,现代化水平日益提高。然而,人们如今越来越关注空气污染问题及其对健康和生活质量的影响
在一定的酶解条件下,用Alcalase2.4L、胰蛋白酶、复合风味酶、酸性蛋白酶、中性蛋白酶等几种蛋白酶对文蛤肉进行水解,测定了这几种蛋白酶的水解度,以及其水解物的氨基态氮含量、
针对秦岭隧洞岭北TBM施工中存在的有害气体逸出现象,为预防和减轻有害气体对施工进程和人员设备安全的不利影响,在现场调查和参阅国内外文献的基础上,通过开展现场气体浓度检
随着城市的快速发展,空气污染越来越严重,尤其是近年来雾霾在多个城市频繁出现,使人们越来越多的关注更小的PM2.5等大气颗粒物的作用和影响。种植园林植物是有效阻滞粉尘、消