基于吉布斯采样算法的模体查找新斱法的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:a63685296
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因转录是遗传信息传递和表达的枢纽,是基因表达调控机制发挥作用的重要环节。转录过程的开启与否首先受到启动子、顺式调控元件、RNA聚合酶和相应转录因子特异性作用的控制,因此识别调控元件是理解基因转录调控机制和表达模式的的关键。传统上是通过生物学实验方法来测定调控元件的,随着计算机技术的飞速发展,科学家们逐渐用计算机模拟来指导实验的设计,以减少实验过程中的尝试性工作。从序列来预测调控元件是基于这样的假设:由于长期进化的结果,受相同调控机制作用的基因(共调控基因)包含相对保守的启动子和调控元件,正是这种保守性使从序列来预测调控元件成为可能。  模体(motif)的定义是指比较短的具有保守性和连续性并且可能具有某种潜在的生物学意义的一段核酸或蛋白序列。为了简化模型,通常基因调控元件识别使用基因转录水平上的简化调控模型,忽略远程作用。共调控的基因很可能在启动子区域共享模体。这样转录水平基因调控元件的识别问题就转化为从一组已知的共调控基因上游启动子区域中寻找共同的模体。  在本文中,首先分析了当前流行的模体查找算法的总体情况和大体分类,并且指出了算法的主要缺陷和发展方向。然后结合吉布斯采样的基本原理,提出一种基于统计分析改进的吉布斯采样算法来改进模体查找的方法。该方法引入了模体库的概念,采用统计分析的方法,有效地改进了吉布斯采样的局部收敛的缺陷,并且提高了模体查找的命中度。和当前的流行算法相比,本文提出的算法在双模体模式的查找方面有比较明显的改进。  本文还分析了当前流行的马尔科夫链(Markov)背景模型用来减少噪声的改进方法,根据背景模型的基本原理提出了一种新的编码方法,该方法对碱基数据采用模拟4进制编码,可以有效管理2至4个连续碱基的概率统计数据。本文还提出了记分函数因子(Scoring Factor)的概念,有效地减少了数值计算中的误差放大问题,通过对一组有生物学意义的数据应用该算法,结果显示该算法有较好的精确度。
其他文献
为了满足消费者个性化、时尚化的就餐需求,主题餐厅作为一种新型营销模式,在市场上受到广泛欢迎.下文中,研究者将结合个人工作实践,总结主题餐厅设计的原则,应予以注意的问题
儿童民间游戏对幼儿教育的全面开展具有重要的推进作用,然而随着时代的发展,儿童民间游戏受场地、新时代的观念、外来文化的影响,已经开展的越来越少.本文从家庭、幼儿、幼师
当前教育的不断发展带动着教学方式的不断创新,我们需要不断改进传统的教学方式来满足现在教学的需要.特别是对于幼儿教育工作者来说,多媒体信息化教学为他们提供了很多便利.
每个孩子生下来,除了先天性遗传的东西,其实他们大多都像一块泥,家长和学校怎么捏他们,他们就会变成什么模样.所以,幼儿学前教育,是至关重要的,这不仅培养他的自信,还全方面
本文结合室内设计现状与规律,简要分析了室内设计的色彩构成特点与要点,并对室内设计色彩应用的发展前景进行了预设,具有一定的借鉴性.
随着人们生活水平的提高,素质教育的普及,社会发展的进步,学前教育慢慢得到家长们的重视.而学前教育往往针对三到五岁的幼儿,这个时期的孩子心理和生理都不是很成熟,所以教学
二尖瓣反流(MR)是心血管临床常见的疾病,彩色多普勒血流技术是临床医生诊断二尖瓣反流最重要的工具,该技术具有操作方便、无副作用、成本低等特点。但是目前基于多普勒血流成
随着CVD金刚石质量及电学品质不断提高,高性能CVD金刚石电子器件的研制已成为该领域的热点研究课题之一。金刚石辐射探测器具有信噪比高、结构简单、可以在极端恶劣环境中正
人类已进入了二十一世纪,新的知识、新的挑战、新的竞争留给了人们更多的发展空间,但这时你会发现或者已经发现:没有一个领先一步的头脑,没有一个善于学习的良好习惯,光凭原
期刊
我国的建筑工程在不断的发展过程中,建筑工程的施工过程一直处于管理混乱状态,由于施工项目所涉及的项目和内容越来越多.虽然建筑施工管理一直在发展的过程之中,但是由于建筑