【摘 要】
:
人类基因组计划完成后,生命科学的研究进入了后基因时代。基因组的研究包括基因识别、信息结构分析以及功能预测等方面,识别真核基因剪切位点是基因识别中的重要的一环。剪切位
论文部分内容阅读
人类基因组计划完成后,生命科学的研究进入了后基因时代。基因组的研究包括基因识别、信息结构分析以及功能预测等方面,识别真核基因剪切位点是基因识别中的重要的一环。剪切位点对基因表达有很大的影响,其能够直接决定、选择与合成哪种蛋白质,而蛋白质的种类直接决定着生物体的性状和功能,所以在国际生物信息学界剪接位点识别研究的重要性日益突出。在早期的研究中,人们使用最基本的生物实验方法识别剪切位点,但是这种生物实验的方法具有很大的局限性——同时仅能有限地检测一条或者是几条DNA序列,并且在实验过程中需要花费大量的人力和物力。生物科学与相关技术的发展积累了大量的生物学相关数据,也让人们认识到不能仅仅依靠生物实验来识别剪切位点,于是计算机技术走进了剪切位点识别这项任务中。由于识别剪切位点就能够直接从DNA序列中得到对应的蛋白质,因其对生物学具有重要的意义,本文使用支持向量机方法分析位于供体位点和受体位点之间的内含子序列与剪切位点的关联性。研究重点如下:
1)分析了供体位点和受体位点之间的内含子序列对基因剪接的影响,并对内含子序列与剪接的关联性进行了研究。研究发现,内含子区别于伪内含子的特征信息同时存在于内含子两端,序列长度约为70个碱基,只要将内含子准确识别出来,就能准确地得到剪接位点。
2)由于标准支持向量机容易受类别差异影响和噪声、野值数据干扰,进而影响识分类效果,本文提出一种将改进的支持向量机算法——加权近似支持向量机应用于剪接位点的识别中,结果表明加权近似支持向量机在预测剪接位点的准确率方面要优于标准支持向量机。
其他文献
自计算机诞生以来,软件开发经历了从机器语言、汇编语言到高级语言的发展过程,抽象层次越来越高,开发人员也越来越多地关注问题本身而不再是一些技术上的实现细节。针对软件
随着存储系统规模的不断增大,存储系统的访问性能、能量消耗及数据可靠性等问题变得越来越显著突出。为了针对上述问题提出有效的解决方案,研究者需要搭建不同结构的磁盘阵列
随着社会经济的快速发展,各类企业层出不穷,伴随着企业的越来越多,商标作为企业的标志越来越受到重视,而商标的设计成为企业发展的重要环节。商标是商品的生产者经营者在其生
随着计算机以及网络技术的发展,Internet目前已经成为人们获得所需信息的重要来源之一,然而网络中存在的大量信息在给人们带来方便的同时也带来了许多的问题,越来越多的个性化信
企业的信息化建设,是指使用企业信息资源规划方法,对企业生产经营所需的数据,从采集、处理、传输到使用各阶段进行全面规划。但信息化建设项目一直被诟病周期长、风险大、成
当前Internet上流媒体应用已成为最广泛、最重要的应用之一,而点播流媒体的交互性使其更受用户的青睐。在传统的IP组播技术,CDN(Content Distribution Network)等技术不能满
信号处理是信息科学的一个重要分支,近几十年来它的基本理论和技术得到了迅速的发展和广泛的应用。其中对夹杂着强噪声的弱信号检测便是其中的一方面。由于它能测量传统观念
随着互联网技术的高速发展,越来越多的数字产品通过网络进行传播。这在给用户带来极大便利的同时,也带来了相应的信息安全隐患。如何采取相应的措施保护作者的版权,如何保证
随着计算机技术、人工智能、图像处理技术和视觉传感器技术的高速发展,智能机器人技术逐渐成为了先进制造与自动化领域的国内外研究热点,并且智能机器人也在教育、医疗、电力、
基于机器视觉的自动检测是一门新兴的检测技术,它综合应用了图象处理与分析、模式识别、人工智能、精密仪器制造等技术。由于基于机器视觉的检测具有快速、精确、非接触等一