基于相位序列及BW转换的减数分裂重组位点识别

来源 :渤海大学 | 被引量 : 0次 | 上传用户:zjinboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物技术的发展及一系列生物基因组计划的相继完成或全面实施,生物学的研究重点已从积累数据向分析解释数据过渡,生物信息学(也称计算分子生物学)便应运而生。其研究内容十分丰富,例如:序列比较、系统发生分析、蛋白质结构类预测、必需基因与非必需基因识别、减数分裂重组位点识别、聚合酶链式反应难易程度预测等等。本文针对减数分裂重组位点识别问题,以数学与计算机科学作为工具,提出了一种新的分类方法。减数分裂重组“冷热点”识别是深入研究重组机制和基因组进化过程的关键。在本文的第三部分,结合Burrows-Wheeler transform算法及DNA的理化性质——扭曲将序列转化为一个新的序列,并命名为原序列的简约序列。通过相位序列的简约序列,构造一个336维的特征向量对DNA序列进行数值刻画。为了剔除不相关或冗余的特征,特征选择是一个必需的步骤。这里,选用一个特征选择工具来对这336个特征进行排序,然后建立最优特征子集,并以此建立支持向量机(SVM)模型。通过Jackknife方法进行交叉验证发现,所提方法的总精确度达到了84.92%,比现有方法的精度都有所提高(从0.83%~4.53%)。这一结果表明,本文所提方法是减数分裂重组位点识别的一种有效工具。
其他文献
自“数字地球”的概念提出以来,空间信息的获取经成为研究的一个热点。三维激光扫描技术是目前发展最为迅速的一种空间信息获取的技术,因其具备测量精度高,采集速度快,真实感
为阐释克雷伯氏杆菌(Klebsiella pneumoniae)的重金属离子抗性机制,本实验采用蛋白质组学的方法,利用双向凝胶电泳技术对不同重金属离子(Ag+、Cu2+、Pb2+和Cr3+)胁迫下K. pne
SCF类型的E3泛素连接酶FBW7是近年来报导的在细胞增殖及分化过程中起重要作用的F-box蛋白,研究表明它是一个很重要的肿瘤抑制因子。SCFFBW7复合物由Skp1、Cullin、Rbxl及FBW7
为了研究城市的非均匀性对城市气象特征的影响,根据南京市landsat卫星资料的建筑密度分布特征,将南京市不同区域的城市分成:商业型城市、高密度城市、低密度城市。利用WRF模拟
空气负离子被称为”空气维生素”,对人体健康十分有益,它具有调节生理机能,促进新陈代谢等作用。近年来,空气质量越来越引起人们的重视,而作为衡量空气质量的一个重要指标,空
上世纪七十年代Szekeres和Seymour提出了著名的双圈覆盖猜想:每个无桥图均存在一系列偶子图使得原图每条边都恰好被覆盖两次。本文推广了普通偶图的定义,引入了符号偶图,从而
不确定规划自2009年提出以来就被应用于各类经典规划问题。机器排序问题在车间管理、计算机系统、自动化生产等实际场景中有着十分重要的应用。2010年,不确定变量被引入机器
本文对Hanoi吸引子的性质进行了部分讨论,首先介绍了Hanoi吸引子的定义和构造,然后对Hanoi吸引子的一个特殊情况——等距Hanoi吸引子K进行了研究。在K上定义了一个局部正则的
2010年12月,我国首次提出了“地理国情监测”的概念。而GPS观测技术在地球物理研究中已有多年的历史,积累了大量的GPS数据,这些数据成功应用于地壳水平运动观测研究,为研究中
本文主要研究了自突触和内噪声作用下神经元网络的动力学行为。首先,研究内噪声和时滞对神经元网络中自突触自反馈活动诱导的动力学行为的影响。研究发现:1、在时滞Newman–W