分类算法在生物信息学中的应用

被引量 : 3次 | 上传用户:nimabe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息数据呈现了指数级数的增长,从这些海量数据中挖掘出有用的信息,已经成为生物信息学研究中急需解决的问题之一。本文主要的研究对象是基因表达谱和信号肽,并通过实验研究发现更有效的分类算法,扩展分类算法的应用空间。基于基因表达谱的肿瘤诊断方法有望成为临床医学上一种快速而有效的诊断方法.但由于基因表达谱数据存在高维数、小样本以及噪音大等特点,使得对其分类存在很大困难,所以很有必要寻找更为可行有效的分类方法。本文提出基于贝叶斯分类器改进的肿瘤基因表达谱分类模型,以结肠癌的基因表达谱作为实验数据,利用MATLAB的贝叶斯网络工具箱进行了实验,并用4-折交叉验证法测试识别准确率,实验结果表明上述方法是可行有效的。信号肽是一种短肽链,用于指导蛋白质的运输,并已成为在寻找新药物和用于基因治疗方面的重要工具。但随着新蛋白质序列在后基因组时代雪崩式的产生,使得新信号肽序列识别成为生物医学工程上的重要任务,也是我们面临的一项重大挑战。本文提出一个基于贝叶斯推理网络称为Signal-BNF的预测方法,用于预测N-端信号肽及其剪切位点。Signal-BNF算法先由多个不同的特征数据集作为贝叶斯分类器的输入,产生多个不同的贝叶斯基分类器,然后通过权重投票系统融合贝叶斯基分类器产生的不同结果,从而得到最终的预测结果。同时,利用MATLAB的贝叶斯网络工具箱进行了实验,以六个不同物种的蛋白质序列作为实验数据,并用5-折交叉验证法测试识别准确率,得到了较高的预测精度。
其他文献
人工社会是美国兰德公司于1991年为研究信息技术的社会冲击的影响提出的,它能够为社会科学的研究提供一个虚拟的“实验室”,使社会学的研究也能够通过实验的方法来进行。这一方
目前我国高等教育已处于从规模拓展到质量提高的转型时期,加强创新团队管理是高校提升质量和水平的重要举措。在科研创新活动中,高校创新团队作为一个提高人才培养质量以及提升
随着石油资源的日益枯竭及土地资源与环境污染问题的日益严峻,天然可降解的生物质材料引起了全世界的广泛关注。海藻酸是一种由β-1,4-D甘露糖醛酸和α-1,4-D古洛糖醛酸组成的
学科核心素养是学生学习这一学科所具备的关键能力,同时也是学生学完该学科后所应有的能力。可以说核心素养既是对教学的本质要求,同时也是在学生学习过程中养成的。随着素质
随着手机的迅速普及,它们在给人们的工作、生活带来便捷的同时,也带来了信息安全方面的威胁。对移动智能终端操作系统安全进行测评是保证移动终端安全和移动互联网安全的基石。
2015年鄂尔多斯市整体经济金融继续保持平稳运行态势,各项指标均持续稳定增长,但地区金融风险状况不容乐观,特别是地方法人金融机构不良贷款仍呈快速增长态势,需要在防范、化
1999年意大利的奥维托市成为世界上第一个“国际慢城”,2010年中国的高淳桠溪成为中国第一个也是目前惟一一个“国际慢城”。截至2011年,世界上共有25个国家的145个城市被国际
针对焚烧炉的炉顶、炉壁局部耐火衬里出现开裂并脱落现象,阐述了耐火衬里材料的选用原则和施工过程控制,检修后运行效果良好。
近年来我国科技型中小企业迅猛增加,成为技术进步中最活跃的创新主体,不仅促进地方经济发展,而且为国家提供创新活力。固然科技型中小企业的发展离不开大量的资金支持,因此融资难
黄安伦创作的极具中国特色的长笛作品《舞诗》,是在加拿大的多伦多留学时创作出来的作品之一。舞诗是他融合了独奏乐器和芭蕾双人舞的特点创作出的,这首曲子的曲风非常特别。在