基于非比对技术的生物序列相似性研究

来源 :福建师范大学 | 被引量 : 0次 | 上传用户:laohe200304
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物序列比对分析是生物信息学研究领域的基础工作,为序列相似性分析奠定重要的理论依据。传统的序列相似性分析方法通常是基于比对的算法,时间和空间复杂度高,对计算机的系统资源也要求较高,随着生物科技的飞速发展,生物序列以指数级的形式增长,面对目前海量级的生物数据已无法满足分析需求。虽然目前已经提出许多非比对方法分析生物序列,但很多非比对模型仍存在运行效率低、耗时且预测精确度低等问题。针对非比对序列相似性分析方法中现存的一些问题,提出以下三个方面的改进思路,并且用实验验证了所提出模型的有效性和可靠性。1.针对传统基于K-词的特征提取方法,忽略词的位置信息,从而导致序列特征提取不完整影响实验效果的问题,提出一种基于位置信息的非比对序列相似性分析模型。通过提取序列K-词,利用词频和词的位置信息计算LF摘,提取序列特征向量,用于蛋白质序列聚类。与现有技术方法相比,聚类结果证明,该模型能够有效地提取序列特征,提高聚类的准确性。2.针对现有的特征提取方法忽略序列频域特征,无法准确反应序列的变化信息,同时为了克服传统的DWT(Discrete Wavelet Transform)因下采样而造成的输入信息遗漏、丢失等问题,提出 SSAW(Sequence Similarity Analysis Method Based on the Stationary Discrete Wavelet Transform)模型。该模型提出一种新的K-词映射方式,通过幅度角的方式将K-词映射到复数域,统计词频并进行标准化,结合K-词的复数表示进行静态离散小波变换获取特征向量,进行聚类和分类。与最近提出的WFV模型和K2*模型相比,实验结果表明,SSAW在准确度、召回率和F1值上都具有优势,并且在大多数情况下,运行时间明显更少。3.针对现有的HGT检测方法准确率低,时间复杂度高等问题,提出基于SRGS(SeqRank and Gaussian Similarity Analysis)的 HGT(Horizontal Gene Transfer)检测方法,利用SR算法(SeqRank)和k-means聚类预测出HGT候选集,然后应用高斯相似性公式将候选集与基因组之间的欧氏距离映射到高维空间进行预测。实验结果表明该模型与其他模型相比,时间复杂度更低,检测效果更好。
其他文献
古埃及文明在世界文明史上占有重要地位,为世界文明留下了丰富的遗产。古埃及人重视来世生活,认为死亡是生命的延续,来世与现世相同,只是现世短暂,而来世走向永恒,正是古埃及人的这种来世观导致古埃及丧葬文化丰富,其中萨布提小雕像是古埃及丧葬文化中最具代表性的丧葬设备。文章介绍了古代埃及丧葬文化中的重要组成部分,即墓葬中的陪葬小雕像——萨布提,萨布提起源于第一中间期,到第三中间期消亡,是墓主的陪葬者,陪伴墓
2018年去菲律宾进行对外汉语教学时,笔者发现去菲旅游的国人众多,但是景点介绍都不甚规范,尤其涉及到菲律宾独有语言和文化之处,翻译并不能使读者理解源语者想要传达的信息。本篇英译汉翻译实践报告选自《畅游菲律宾》,该书介绍了关菲律宾地区的主要自然景点和人文景观,以吕宋、米沙鄢和棉兰老岛三大岛群分类进而细数各地景点。菲律宾本国官方语言为他加禄语和英语,由于长期的殖民历史,所以语言和文化中都掺杂了许多异国
作为一种兼具计算机化自适应测验(CAT)和计算机多阶段自适应测验(MST)优点的测验形式,在线组卷的计算机多阶段自适应测验(OMST)不仅可以根据被试能力和非统计约束需要进行即时组卷,还允许被试在模块内回顾、修改作答。OMST降低了被试的测验焦虑,从而使收集到的数据更为真实合理,并使参数估计结果更符合被试的真实水平。在教育和心理测量领域,能同时提供被试宏观能力和微观认知状态的认知诊断自适应测验(即
随着科技的进步、国家经济的快速发展,交通基础设施的建造也在如火如荼的进行。大量的桥梁被建造,其中不乏跨海、跨江的大桥,因此避免不了水中施工作业,桥墩的施工需要在无水
目的:随着核技术的发展与放射治疗在临床肿瘤治疗领域的广泛应用,如何有效防护急性辐射损伤已成为核安全领域的重要研究内容。本课题以小肠隐窝Bmi1+干细胞为主要研究对象,以
目的探讨联合第三方脐血回输的单倍体造血干细胞移植(haplo-cord-HSCT)后合并慢性移植物抗宿主病(c GVHD)的临床特征及影响生存的危险因素。方法回顾性总结苏州大学附属第一
光电化学生物传感器是一类通过光敏物质的光电转换特性确定待测物浓度的检测装置。因其具有设备简单,灵敏度高,易于操作等优点,越来越多地被用于生物分析领域。本文基于不同的信号放大策略构建了几种传感器,用于对待测物进行检测。1.以PEI敏化的TiO_2介晶作为光敏基质,利用Peptide@B-CQDs复合物的协同抑制作用,构建了一种“on-off-on”型胰蛋白酶光电化学传感器。当待测物胰蛋白酶引入体系时
本文从工程项目管理的基本原理出发,具体探讨了,工程项目管理的理论与实践新进展,以及项目管理在我国国情下的具体现状以及存在的问题,针对这些问题,并根据项目管理的发展趋
磁共振成像由于其无创性,并能提供多对比度体内成像信息,已在临床医学上得到了广泛的应用。然而,长时间采集带来的不舒适感及运动伪影等因素限制了磁共振成像在时间要求严格条件下的应用。为了加速磁共振成像,一般对k空间欠采样数据使用压缩感知算法进行重建,或者对时域空间低分辨率图像进行超分辨率重建。传统最优化算法已经在欠采样磁共振图像重建上取得了很好的效果。然而,当采样率过低的时候,比如低于20%,传统方法难
背景超极化激活环核苷酸门控阳离子通道4(hyperpolarization-activated cyclic nucleotide gatedcation channels 4,HCN4)主要在心脏窦房结表达,与心脏起搏电流的产生有着密切关系,因此HCN4基因又被称为心脏的起搏基因,HCN4基因突变会导致窦房结的功能障碍和心脏传导系统的功能发育的异常。出生后HCN4是否在心脏成纤维细胞、心肌细胞和