基于支持向量机的真核生物mRNA翻译起始位点的识别

来源 :云南大学 | 被引量 : 0次 | 上传用户:FOFOXX
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成,生物学已经步入后基因组时代。有越来越多的学者开始热衷于探究功能基因,其中真核生物翻译起始位点的确定就是较为困难的问题之一。鉴于人类基因组研究所面临的海量数据以及实验方法有自身的局限性,如何采用高效科学的智能化模型识别真核生物翻译起始位点(TIS)是目前生物信息学研究工作的重要任务。   本文通过机器学习的方法来识别翻译起始位点。选取mRNA序列样本,采用位置向量和碱基频率向量作为不同的输入特征向量,基于支持向量机的linear、RBF、polynomial和sigmoid四种算法,分析五种真核生物人、鼠、兔、猪、牛的TIS序列样本。考察不同特征向量和不同核函数算法模型对识别效果的影响。实验结果表明,在所选样本序列范围内,位置向量作为输入支持向量机的特征向量时识别效果要高于碱基频率向量;而四种算法中,RBF算法和polynomial算法的识别效果要高于linear算法和sigmoid算法。改变样本序列长度获得相同效果。提示,在人工智能对RNA翻译起始位点的识别过程中,基于样本TIS附近序列的统计特性,位置向量由于其多维性要优于碱基频率单一性的识别效果;RBF算法和polynomial算法与其他的两种算法相比,表现出参数少、精度高等优点,其识别效果更好。
其他文献
随着移动通讯技术的不断进步与提升,手机移动终端所需要满足的功能也逐渐多样化,因此,对手机天线的性能指标也提出了更高的要求,相关研究也朝着集成化、通用化、小型化等方向
OFDM调制技术弥补了单载波调制在强多径衰落情况下的复杂的信道估计电路设计,是无线传输系统中通用的技术。 地面数字视频广播(Digital Video Broadcasting-Terrestrial,D
为探究高寒灌丛生态系统根系分泌物输入规律及其诱导的根际土壤生态N素转化对大气氮沉降的响应规律,本文以青藏高原东缘窄叶鲜卑花(Sibiraea angustata)灌丛为研究对象,采用根
学位
自动测试技术已广泛的应用于航空、航天、武器装备、能源等重要领域,成为复杂系统与设备质量的必要保证。遥测舱是多种飞行器的重要部件,其质量的提高,对于减少飞行器研制过
功/时分复用区域型光纤振动传感系统以若干只光纤振动传感器作为敏感单元,通过功/时分复用方式级联,通过后端的光信号解调、分析与处理,实现对入侵事件的判断、定位、报警。
本文通过对荣华二采区10
期刊
榕树-榕小蜂共生体系既存在互惠的关系,也存在竞争共同资源的负面关系,如何合理地分配花序内的繁殖资源是维持榕树-榕小蜂共生体系的核心问题。性比理论同样是进化生物学研究的
不饱和脂肪酸(Unsaturated Fatty Acids,UFAs)作为一种基本的营养成分,对于维持生命体的正常生理功能具有非常重要的作用。不饱和脂肪酸可以参与调控细胞膜的流动性以及韧性,此外
海马位于内侧颞叶,属于大脑皮层的边缘系统,是学习记忆的主要脑区。海马结构在空间上分为背侧和腹侧两部分,在亚区上可分为不同亚区,主要包括DG,CA1,CA2,CA3,下托以及内嗅皮层。以往