植物启动子识别算法研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:winxb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因草图的绘制完成,基因组学研究已进入了“功能基因组学"时代,如何在海量的序列数据中确定基因及它们的调控网络已经成为目前最具挑战性的任务。启动子作为控制基因转录起始和转录频率的重要元件,在基因表达调控机制中具有非常重要的作用。启动子识别是确定基因的关键问题之一。由于真核启动子与人类及人类的生产生活密切相关,真核启动子识别已成为一个热点研究领域。在真核启动子识别技术中,哺乳动物(人类和小鼠)启动子识别取得了许多重要成果,而对于真核启动子中的另一个重要分类——植物启动子识别的研究还处于起步阶段,关于植物启动子识别方法的研究论文较少,其中缺乏实验证实的启动子数据是制约其快速发展的原因之一。近年来随着植物数据库的完善,植物启动子识别逐渐成为生物信息学的一个研究热点,其中,特异性较低是有待解决的难题之一。在阅读了大量国内外文献的基础上,对植物启动子识别算法进行了深入分析与研究,并针对现有植物启动子识别算法中假阳性高的问题,提出了两种新的植物启动子识别算法。提出了基于GC偏好和支持向量机(SVM)的植物启动子识别算法。其特点是充分利用了植物启动子的GC偏好特性和SVM分类器的优秀分类性能。该算法首先通过对GC含量的分析将DNA序列分类为GC偏好序列和非GC偏好序列,然后进行结构特征和信号特征的提取,最后通过SVM分类器进行植物启动子识别。SVM分类器由四个SVM子分类器组成,每个子分类器专门针对启动子和四种非启动子中的一类进行区分。四个子分类器分别是启动子——3’UTR子分类器,启动子—5’UTR子分类器,启动子—Intergenic子分类器和启动子—CDS子分类器,综合四个子分类器的结果来识别植物启动子序列。提出了基于GC偏好和DNA双链特征的植物启动子识别算法。该算法的系统结构与第一个算法基本相同,其特点在于,将GC偏好特征和DNA双链特征相结合,提取的特征更具有分辩力。实验结果表明,所提出的两种植物启动子识别算法是有效的,具有较高的特异性。
其他文献
种蛋自身的品质、孵化卵发育过程中所处的环境以及健康状况等因素,都与孵化卵的成活性密切相关。种蛋孵化过程中胚胎成活性检测是孵化工作的重要技术环节。鉴于人工检测劳动强
模糊集理论是美国自动化控制理论专家Zadeh教授于1965年创立的,目前已被广泛应用到了冶金、化工、家用电器、金融、医学等多个领域。但是模糊集隶属度函数的准确选取比较困难,
图形处理器(GPU)因为其独特的硬件架构,硬件性能提升一直非常迅速。GPU在密集型运算方面表现出的强大性能,使其在通用计算领域得到了越来越多的重视。GPU通用计算的概念很早
秘密共享作为现代密码学的一个重要分支,能够有效地保证信息的安全,在重要信息和秘密数据的安全保存、传输及合法利用中起着关键的作用,成为信息安全领域的研究热点。秘密份额交
在现实世界的一些生产制造企业中,存在一类由生产加工站作为加工主体的生产线,其中,加工站由传送带输送工件进行加工,这类系统称为传送带给料加工站(Conveyor-serviced production station, CSPS)。由于专业化、规模化的需求,生产线往往有多道工序,一道工序由多个CSPS组成,称为多工序CSPS系统。多工序CSPS系统中,每道工序拥有各自的一般站点,在相邻的上游工序和下
随着计算机网络的发展和多媒体压缩技术的逐步成熟,多媒体数据在网络上的传播变的日益普及,使得多媒体数据的拷贝和分发变的容易。因此,如何保护媒体的数字版权,己成为当前亟待解
全局优化问题大量存在于科学研究和工程应用的各个领域,对全局优化方法的改进与应用具有重要的理论意义和实用价值。微分进化算法是一种模仿自然界生物进化过程中“优胜劣汰、
无线传感器网络(WSNs)是由大量的传感器以自组织和多跳的方式构成的无线网络,它综合了传感器技术、嵌入式计算技术、无线通信技术和分布式信息处理技术等,能够利用传感器实时监
光学层析成像技术以近红外光作为光源照射生物组织,对组织体的光学属性参数进行成像。光学层析成像技术因其安全可靠、无放射性损伤而受到人们的关注,采用这种技术的成像设备
21世纪,社会对知识和人才的需求不断增大,现今社会需要什么样的人才,在高校现有的培养体系下,高校培养的人才质量如何,学生是否能够实现就业,所掌握的知识和技能是否能够满足