基于Tsallis熵的核小体定位研究及预测

来源 :山东大学 | 被引量 : 0次 | 上传用户:riyueshen1969
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为真核生物染色质的基本组成单位,核小体控制了转录因子与结合位点的结合通道,故在DNA复制与修复、RNA剪接、基因转录调控等基本生命过程中扮演着重要的角色。核小体定位是对全基因范围内核小体精确位置的预测。  首先,在对已有核小体定位模型的研究基础上,本文从核小体定位具有序列依赖性的理论基础上,应用统计方法提取DNA序列k(k=2,3)连体的频数,并结合Tsallis熵DNA序列的双螺旋结构提出了一种新的提取核小体定位信息的模型。基于该模型,每条DNA序列用8维向量表示,方便我们利用数学物理手段进行核小体定位研究。接下来,本文基于相对距离概念提出了核小体占有率模型,确定了全基因范围内每个位点被核小体覆盖的可能性。最后,本文提出了峰值识别模型建立了全基因序列上的核小体定位图谱。当用于训练支持向量机时,核小体定位信息模型区分五个物种(Human,Medaka,Nematode,Candida,Yeast)的核小体DNA序列以及连接DNA序列的AUC值分别为0.9182,0.8922,0.9163,0.8261和0.9109,优于以前发表的模型结果,说明了核小体定位信息模型的有效性。此外,本文将全基因序列上的核小体定位图谱与Kaplanetal[10].,Segaletal.[5],Yuanetal.[4]的论文结论进行比较,结果显示本文提出的核小体定位模型是可行的,准确度较高。  本文主要有以下三方面的成果:  一、本文基于Pearson相关性,将四种核菅酸(A、C、G、T)分为两类,简化了DNA序列的数学向量的构成;  二、本文首次将Tsallis熵进行变形,并应用于核小体定位研究,拓宽了核小体定位的研究思路;  三、本文应用距离概念来进行序列的相似性分析,很大程度上简化了计算的复杂度,使大数据量的核小体定位计算难度降低。  本文基于核小体定位信息模型,核小体占有率模型以及峰值识别模型得出了啤酒酵母全基因序列上的核小体定位图谱,但是影响核小体定位的因素很多,例如DNA序列的依赖性、蛋白质分子的竞争与合作、ATP依赖重塑复合物等多种因素。如果我们可以更加系统的分析这些核小体定位的影响因素,得到一个综合的定位模型,那么预测的结果会更好。此外,不同的生物核小体的定位机制不尽相同,我们需要做的是将本文方法进一步的应用于更加复杂的真核生物,例如人类数据,深入确定本文方法的适用范围及改进方向。目前,研究者们还没有给出一个完全客观正确的核小体定位图谱,不同方法、平台得出的预测结果存在差异。因此,我们需要进一步的借助实验的手段来确定本文模型的精确性。
其他文献
近年来,尽管全基因组用tagSNP(代表性单核苷酸多态)检测普通疾病与常见变异的关联已经取得了一定的成效,但用来检测稀有变异关联的研究还未取得较好的成果。近年的研究表明,普通疾
人类的疾病多为由遗传和环境因素共同作用引起的复杂性疾病。目前全基因组关联分析(Genome Wide Association Study)已经成功鉴定了上千种与人类复杂性疾病相关联的SNP位点。
在解析数论中,SL(n,Z)上尖形式的傅立叶系数的性质是个非常重要的研究课题,著名的Ramanujan-Petersson猜想仍然是个没有解决的问题.这个猜想是说任何一个尖形式的第n个傅立叶系
近几十年来,由于反周期解问题在物理、生物和经济等众多学科领域都有广泛的应用,因而微分方程的反周期解问题受到国内外众多学者的广泛关注,并取得了很多有意义的结果.本文主要
本文利用变分方法研究了几类非线性微分方程的多解问题.全文分六章.  第一章,介绍了本文的研究背景和主要工作.  第二章,讨论次线性二阶Hamiltonian系统ü-L(t)u+Fu(t,u)=0
LB3000XC环保节能沥青混凝土拌和站是无锡华通公路机械科技有限公司自主研制、不断创新并参考了国内外多家间歇式沥青拌和站的优点研发的产品。其技术含量高、设计理念先进,
“为人民服务”,作为中国共产党人的根本宗旨,当时在延安时期提出有着全新的时代内涵。正如毛泽东同志所说的“共产党人的一切言论行动,必须以符合最广大人民群众的最大利益,
多孔介质中的流体运动方程广泛应用于地下水、环境科学和油藏模拟等领域.模型主要包括了流体的流动和质量的转移,体现着流体本身的质量守恒、能量守恒等物理性质.其中重力、粘
对于有正Picci曲率的黎曼流形N,任一闭的超曲面M可以将N分成两个连通区域Ω1和Ω2,使得(a)Ω1=M=(a)Ω2.本文主要研究当M为凸超曲面时,在Ω1上的Laplace算子△的第一特征值估计,
Hayman猜想问题自上世纪50年代提出,已有60余年,在此期间,国内外组许多专家学者对这类问题进行进行了全面的研究,并将其推广到p-adic域上,考虑p-adic域上的超越亚纯函数的Hayman猜