病毒准种单体型重建优化算法设计与分析

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:ibyxpr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
病毒准种是指由于突变和相互竞争形成的核酸序列结构高度相似的病毒群体。重建出准种中不同单体型的基因结构对研究病毒准种多样性和流行病学的关系、研制更有效的治疗药物有重大意义。高通量测序技术的发展为病毒准种的研究提供了新的途径,病毒准种单体型重建是指利用病毒准种的高通量测序读段数据重建出该准种各病毒株的单体型序列。目前的高通量测序技术产生的读段数量较多,并且在测序过程中混杂着大量的测序错误,因此病毒准种单体型重建存在着巨大的挑战。针对这个问题,本文设计了一个病毒准种单体型重建优化算法。首先,该算法综合了多种读段筛选方法,对低质量读段进行了淘汰;然后,融合了基于泊松分布模型和基于汉明距离聚类方法对DNA读段进一步纠错;进而,采用基于多项分布全局重建模型对经过纠错处理后的读段进行病毒准种单体型重建;最后,采用聚类算法实现单体型频率的估算。大量实验结果表明,与QuasQ和QuRe算法比较,该算法在单体型重建数量、精确率、F-measure等指标上都表现得更好。已有病毒准种模拟数据生成方法中采用的碱基突变方式及突变分布模型单一,为了解决这一缺点,本文设计了一个病毒准种模拟测序生成器。该生成器基于病毒株突变位点分布模型和病毒株频率分配模型,调用ART模拟测序工具,生成模拟数据,更好地模拟了准种中各病毒株的基因突变和频率分布情况。本文同时设计了一个病毒准种模拟测序生成器的可视化界面,直观明了地显示了模拟数据特征,且模拟数据支持导出,易于保存,为后续的研究工作提供了极大的便利。
其他文献
胞质分裂是一个有丝分裂周期的最后阶段,这个阶段正常完成的结果是染色体和细胞质平均的分配到子细胞中。胞质分裂的缺陷将导致多核细胞的形成,也就是染色体的异倍化,在多数
端粒由5-15kb的“5-TTAGGG-3”短串联重复序列与特殊蛋白结合构成,位于染色体末端,发挥着维护染色体结构稳定性的作用。端粒酶是一种特殊的逆转录酶,其关键亚基hTERT催化端粒
在共生固氮微生物中存在一类大豆根瘤菌,它们与宿主植物形成共生固氮体系后进行生物固氮,进而为宿主植物提供生长所必需的氮元素,植物获得氮元素通常都是靠吸收铵盐、硝酸盐
目的:UBE2I是SUMO化修饰过程中的E2连接酶,能转移泛素样蛋白SUMO到目标蛋白上,使目标蛋白发生SUMO化修饰;Nmi是一个可提高IL-2和IFN-γ依赖的转录活性的干扰素诱导蛋白,在IFN
黑根霉(Rhizopus nigricans)属于接合菌亚门的根霉属,菌丝无隔,细胞壁成分复杂,制备原生质体较为困难且研究较少阻碍了对其进行转化改造。本实验尝试了不同酶和各种酶解缓冲
近年来随着新经济发展趋势,我国在大力推进“万众创新,大众创业”策略,各种类型的众创空间在政府的扶持下陆续发展。为贯彻落实《国务院办公厅关于加快众创空间发展服务实体经济转型升级知道意见》文件精神,使众创空间向健康有序的方向发展,升级为具有时代意义的服务型众创空间---服务集成商,要求我们对其发展关键进行思考。同时成为服务集成商的关键在于对众创空间服务质量的改进提升,所以如何在如“雨后春笋”般的众创空
防御素是近年来发现的具有广谱抗菌活性并在机体抵御外来微生物入侵时起防御作用的一类阳离子小分子多肽。人防御素有着较强的抗菌活性和广泛的抗菌谱。防御素相对于当前广泛
黑曲霉(Aspergillus niger)是工业上发酵生产柠檬酸的重要菌株,黑曲霉发酵生产的柠檬酸在食品、化工、制药、纺织业等行业都有广泛应用。乙酰辅酶A是生物体内碳源分解代谢、
昆虫作为自然界中种类最为繁多的物种,数量庞大,分布广泛。它们要面对各种环境的影响及病原微生物的入侵,因此,在长期的进化过程中,昆虫形成了独特的先天免疫系统,主要包括体
伤害性神经元作为机体感知伤害刺激的初级感觉神经元,对机体生存具有非常重要的意义。根据这些神经元是否表达多肽类神经递质,可将其分为肽能和非肽能神经元。目前,对转录因