微RNA基因机器识别算法的开发与优化

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:asfaweawrv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物学的不断发展,越来越多的先进技术被应用到生物学的研究中来。本文将人工神经网络、支持向量机等计算机模式识别方法巧妙地与生物学结合起来,从而更好地解决生物问题。 微RNA是非编码小RNA中的一种,长度约21~25个核苷酸,它广泛存在于真核生物中。微RNA的研究从最初只发现一两个小分子RNA到不同的物种中大量微RNA的发现,引起大家广泛的关注,其调节的功能也越来越受到重视。 目前鉴定微RNA的方法大致分为生物实验方法和计算机识别方法两种。生物实验方法准确率高,但相对成本较高、实验周期较长等缺陷制约其大规模应用。计算机识别方法以其成本低、效率高、处理信息量大、适合大规模预测等优点快速发展。依据其识别算法不同可分为两类:基于比较基因组学的方法和基于人工智能的方法。基于比较基因组学的方法需要已知与待测物种保守性高的同源序列中微RNA的信息。基于人工智能的方法又称从头预测算法,可相对独立地对待识别序列进行预测。 特征提取的优劣直接影响着识别算法的准确率,因此寻找合适的特征是设计智能识别算法的关键。本文基于微RNA前体序列的二级结构,在前人工作基础上提出双边同步滑窗法进行特征提取与统计。此方法有效去除冗余信息,压缩特征向量的维数,提高算法效率。 人工神经网络和支持向量机是模式识别领域研究中的热点算法,本文基于人工神经网络算法和双边同步滑窗法开发了微RNA识别程序。通过识别已知人类微RNA序列来验证所提特征和识别算法的有效性,得到了良好效果。进而使用支持向量机方法进行验证,进一步验证了使用双边同步滑窗法进行特征提取和统计具有良好效果。
其他文献
在本实验室前期构建的辽宁绒山羊毛囊兴盛期cDNA质粒文库中,经拼接测通后得到了辽宁绒山羊proteasome maturation protein(POMP)基因序列,旨在研究辽宁绒山羊PMOP基因在毛囊
本文对藏东南地区农业结构调整方向进行了研究。文章在分析当地资源优势、市场需求及农牧业中存在主要问题的基础上,提出了藏东南地区米林县农业结构的调整方向:种植业结构调整
本论文对甲壳动物早期幼体的渗透生理适应性作了研究,主要探讨了①盐度对凡纳滨对虾仔虾的离子转运酶活力和存活、生长的影响;②pH对凡纳滨对虾仔虾离子转运酶活力和存活、生长
翻转课堂是学生先学,教师后教的新教学模式.它通过重新调整课堂内外的时间,使学生由被动学习变为主动学习.文章对形容词比较级和最高级的语法教学进行分析研究,探讨翻转课堂
猪传染性胃肠炎(Transmissible gastroenteritis of swine,TGE)是由猪传染性胃肠炎病毒(Transmissible gastroenteritis virus of swine, TGEV)引起的一种高接触性传染病。在
粘着斑激酶(focal adhesion kinase,FAK)是细胞质内单亚基非受体型酪氨酸激酶,通过各种信号途径参与调节细胞生长、发育、黏附、细胞骨架重组、转化、扩散和迁移等过程。一采用
串珠藻属属于红藻门,真红藻纲,串珠藻目,串珠藻科,是一个具有明显特征的自然类群。目前已报道的全部种类均生活在淡水中,作为串珠藻科的模式属,是串珠藻科中分布最广,种类最多的属。
类风湿性关节炎(RheumatoidArthritis,RA)是一种慢性、全身性的炎性自身免疫病。细胞因子、Th1/Th2细胞平衡、细胞凋亡等在RA的发病过程中起着重要作用。人诱骗受体(DcR)3是新
我国蛋鸭、肉鸭和鹅的饲养量均居世界之首。其中蛋鸭存栏量占亚洲的80%、世界的66%。这标志着我国需要更多地种鸭,选育优质高产的种鸭势在必行,而传统育种手段费力费时,分子
麦醇溶蛋白和高分子量麦谷蛋白亚基作为小麦贮藏蛋白的重要组成部分,其组成和含量对小麦面粉的烘烤品质有重要影响。近年来随着小麦胚乳贮藏蛋白研究的不断深入,麦醇溶蛋白和高