基于cis顺式元件的衣藻poly(A)位点的识别研究

来源 :厦门大学 | 被引量 : 1次 | 上传用户:Red_Cell
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从全基因组测序成为可能以来,基因组结构注释(包括了解基因组DNA中的基因组成、结构及其调控元件)成为生物信息学研究的重要问题。随着越来越多的生物体的DNA被测序出来,对大量的序列进行基因组分析并从中获取有价值的信息变得日益重要。mRNA序列中多聚腺苷化位点(简称poly(A)位点)识别是基因识别的重要组成部分,对poly(A)位点的正确识别有助于确定基因编码的终止位置,这在基因组分析中有重要的应用意义。 人们普遍认为,用来识别poly(A)位点的信号定位在剪切点的附近。在许多哺乳动物的poly(A)位点的上游10—35nt的区域定位了一个六联子AAUAAA。由于其保守性,它通常被认为是poly(A)信号(PAS)。而且我们发现在酵母和哺乳类中出现的大部分cis顺式元件也都存在于植物的poly(A)位点区域。此外,国际上最新的研究成果表明,在藻类的位点上游区域也存在poly(A)信号。因此,我们有理由相信,在所有真核细胞的poly(A)位点周围存在着一些保守的cis顺式元件,这些cis顺式元件对mRNA前体的多聚腺苷化过程(即poly(A)位点的形成过程)具有调控作用。 本文根据衣藻(Chlamydomonas)poly(A)位点上下游周围序列cis顺式元件的特征,运用层次聚类的方法来建立poly(A)位点的识别模型。对建立模型采用的训练集数据,使用Z算法进行提取,并通过WEKA supervised attribute filter进行特征筛选,获得cis顺式元件。接下来自定义了对象间距离,采用层次聚类的方法对上述cis顺式元件进行聚类得到cis顺式元件组。最后转化这些cis顺式元件组为PSSM,依据PSSM建立用于分类的cis特征,分别采用决策树分类法与贝叶斯分类法,构建出完整的poly(A)位点识别模型。该模型可依据训练结果,对待测序列中可能含有位点的序列进行分类,判断其中含有位点的情况。本文使用建立的识别模型对测试数据进行测试,并对两种分类方法的识别结果进行对比和分析。模型的测试结果表明,本文所建立的模型是一种有效且高性能的poly(A)位点的识别模型。
其他文献
随着计算机技术的广泛应用和网络技术的不断发展,系统结构越来越复杂,基于复杂系统的多智能体系统以其优良特性,博得众多学者的高度关注。采用多个简单廉价的智能体协调完成复杂
本文主要研究了XY位置系统的运动控制问题。XY平台在现代工业中应用相当广泛,并且随着现代工业的急速发展,工业界对高速高精度加工制造的需求越来越大,在高速运行条件下系统的跟
感应电机的无速度传感器矢量控制是目前电气传动领域研究的热点之一,其主要研究内容为在存在参数变化、扰动及各种不确定性干扰的情况下,如何采用一种快速、有效的方法对转子磁链、转子转速进行较为准确的观测。无速度传感器的矢量控制技术是在带速度传感器的矢量控制基础上发展起来的,因此,本文首先介绍了坐标变换、异步电机的数学模型、磁场定向矢量控制的原理和空间矢量脉宽调制技术(SVPWM)原理。而后介绍基于滑模变结
本文主要针对含有有界不确定性的非线性系统的优化跟踪控制进行了研究。在实际的控制系统中,绝大多数系统都是非线性系统,而且这些系统的精确模型很难得到,再加上系统中存在
当今,全球经济高速发展,能源短缺问题加剧,所以新能源的开发与应用在世界各国掀起了研究热潮。其中燃料电池作为高能量密度可移动电源的代表被广泛应用在移动通信、微型动力
高精度轧制技术对冷轧机液压AGC系统的控制提出了更高的要求,对冷轧机液压AGC系统进行研究具有重要现实意义。本文以某钢厂五机架冷连轧机组第一机架液压AGC系统为对象,进行了
复杂仿真系统VV&A是仿真系统开发中必不可少的重要环节,而VV&A工作中搜集评估对象和评估标准的过程是繁琐的。仿真需求管理可以为复杂仿真系统VV&A提供评估对象与评估标准的跟
基于ARM和uC/OS-II的I型工业绣花机控制器初步研制成功,在硬件系统已经完成的前提下,必须确保控制系统软件的流程清晰,代码作用明确,才能保证系统运行稳定,易于升级维护。然
伴随着新能源技术和微电网技术的发展,储能变流器(PCS-Power Converter System)作为连接公共电网及储能设备之间的纽带,受到越来越多的学者的关注,储能变流技术也有了日新月异的发展。本文主要研究双向储能变流器的整体结构与控制器设计方法,分别确定了双向交流-直流变流器、双向直流-直流变换器拓扑结构,给出了电路相关器件的参数计算方法。在此基础上分别建立了双向直流-交流变换器和双向直流
当今,为适应更高的工业生产要求,许多设备制造商都致力于提高自身系统的速度与精度。大多数的封装任务不仅需要视觉辅助定位,而且需要测量机器人操作手的末端与物体之间产生的