支持向量机算法研究及在基因表达数据分析中的应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:tian_mizhen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计学习理论是一种专门研究有限样本情况下机器学习规律的理论,它不仅考虑了对推广能力的要求,而且追求在现有有限信息的条件下得到最优结果。支持向量机是在统计学习理论的基础上发展而来的一种新的机器学习方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。微阵列技术的到来将对生物学和医学产生一场革命,通过它可以同时观测成千上万个基因的表达水平,从而能够在基因组水平上以系统的、全局的观念去研究生命现象及其本质。微阵列基因表达数据具有维数高、样本小、非线性的特点,这对一些传统的机器学习方法提出了新的挑战,对其数据的分析已成为生物信息学研究的焦点。通过几个典型的微阵列基因表达数据集,可以研究支持向量机的理论和具体应用。在理论上讨论了统计学习理论的几个关键问题和支持向量机的原理,给出了支持向量机的训练方法-序贯最小优化的实现方法;针对样本数目不对称的情况,给出了改进的支持向量机模型,通过模拟数据验证了新模型的有效性;以支持向量机理论为基础,针对微阵列基因表达数据集,实现了基于支持向量机的微阵列基因表达数据分析软件,给出了分类器的构造模型:采用信噪比方法进行基因特征提取,用最小-最大方法进行规范化,用支持向量机构造分类器,把该模型和支持向量机的改进方法应用到几个典型的基因表达数据中,取得了较好的实验效果。
其他文献
随着移动互联网的兴起,在线社交网络迅猛发展。在线社交网络作为一种新形式的传播媒介,有不同于传统媒介的传播模式。如何利用在线社交网络,有效地解决弘扬正能量、控制谣言
随着信息科学技术的发展,电子商务逐渐繁荣并对网络安全提出了新的要求和课题,PKI(Public Key Infrastructure)是一种是以密码学技术为基础,通过灵活搭配应用各种安全机制技
论文主要研究了多Agents系统,并以FIPAAgent抽象架构为参考模型,构建了一个InternetAgents平台,由此探讨MAS(Multi-AgentSystem,多Agent系统)的组成形式、各Agent的通讯以及合作
随着通信技术的迅猛发展,飞速膨胀的通信量成了下一代移动通信网络中最关键的问题。而中继,以其性能佳,易于拓展,部署方便等优势,在新一代网络标准中占有一席之地。本文挑选
Internet和Web技术的发展为现代远程教育提供了新的教育手段和技术支持。基于Internet的现代远程教育通过构建一个开放性的教学环境,克服了传统教育在时间、空间上的限制,对于
学位
作为计算机科学研究领域的热点问题之一,基于图像的三维重建渗透了摄影测量学、计算机图像处理、计算机视觉学科等相关技术,为了确定场景图像的几何结构,该技术通过各种裁剪操作
作为近年来发展最为迅速的几项新技术之一,工作流技术是实现企业业务过程建模、仿真分析、优化、管理与集成,从而最终实现其自动化的核心技术。采用工作流管理将使企业按照要实
Internet应用的普及,要求企业内部网的职能范围超越物理位置上的限制,同时,网络上传输的数据也需要越来越高的安全保障。随着应用程序从C/S结构向Web的迁移,如何在不影响外部
内存数据库系统(Main Memory Database System)是实时系统和数据库系统的有机结合。当前,内存数据库系统广泛应用于航空、军事、电信、电力、工业控制等许多领域,而这些应用领域大部分都是分布式的,因此分布式内存数据库系统成为新的研究热点。 论文以分布式内存数据库系统为研究对象,在C++环境下,结合面向电网监控系统的分布式内存数据库系统的开发,得到以下几方面的研究成果: