微阵列基因表达数据的特征选取分类研究与孤立点检测分析

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:wjlwny110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA微阵列(基因芯片)技术的出现,使人们能够获得高通量的基因表达数据,这将成为今后重要的生物医学研究工具。但微阵列数据具有小样本、高维度的特点,这给数据分析带来了困难,从中挑选主基因即进行特征选取是十分重要和有意义的。 在数据挖掘中,孤立点检测有着重要意义,可以用来发现数据集中小部分对象,以提高数据质量或发掘含有重要信息的数据单元,对于微阵列数据进行孤立点检测是十分有必要的。 在特征选取分类方面,本文使用遗传算法挑选主基因,其中用k最邻近方法作为模式识别方法,使用支持向量机构建一个分类器,运用不同核函数进行预测分类性能测试。通过实验,在经典的白血病微阵列数据集上,对于34个样本的测试集,达到了100﹪的分类准确率,表明本系统对于该基因表达数据具有很好的分类识别能力。 在孤立点检测方面,本文提出一种新的基于KNN图的孤立点检测方法——“两阶段法”。通过实验,该方法在模拟高维数据、真实低维数据(NBA数据)和真实高维数据(微阵列结肠数据)中表现良好,对于结肠基因表达数据检测得到的6个孤立点具有一定的代表性,表明本方法能够有效地检测孤立点,并且适用于高维微阵列数据分析。
其他文献
第十八届北京·埃森焊接与切割展览会将于6月18~21日在上海新国际博览中心举办。北京·埃森展览是世界两大焊接展之一,其参展商来自30个国家和地区,观众来自全球近80个国家和
目前,我国大部分油田已进入开发中后期,它们面临很多非常重要的问题,如技术、经济、政治等方面的问题。而石油是不可再生能源,石油企业在这些因素的影响下,如何保持稳产和可持续发
本文研究微分动力系统中的控制分解。具体地,研究控制分解、同宿切现象、稳定和不稳定子空间之间的夹角三者之间的关系。 我们证明了,给定C微分同胚f,给定正整数i,如果对于所
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
在本原矩阵的研究中,对指数γ(A)的估计和指数集En的刻划这两个问题引起了不少人的兴趣.Wielandt[1]在1950年首先给出了n阶本原矩阵的一般性上界γ(A)≤(n-1)2+1,于是En(∈){1,2
2013年3月28日,“平民史诗——许鸿飞雕塑展”在中国美术馆拉开帷幕。许鸿飞精心创作的56件“肥女”雕塑,为参观者献上了一道丰厚的视觉审美大餐。许鸿飞的世界巡展以此为起点拉开了序幕,许鸿飞在不到2年时间内带着他的展览相继走过了澳洲、意大利、法国、英国、新加坡等地共12站。世界各地的展览中均取得了成功。“12”在中国是一个轮回数字,因此,踏入第13站,他选择了回到北京。  2015年1月5日,许鸿
风险测度理论是经济学和金融学的基础理论。风险的正确计量是正确决策的前提;度量方式的简洁和计算方便是风险计量模型广泛应用的重要条件。在资本投资市场,根据其特性,用资本半
图的控制理论是图论中的重要研究领域.它不但有着古老的历史,而且在现今的图论研究中依然相当活跃.本文的研究对象是树的强控制数和n·Cm反符号控制数.  树,作为连通图中最简
古诗词教学是初中语文的重要内容之一,但是很多学生不愿意上古诗词课,因为很多课堂都是老师串讲一下,然后学生们背一背,课堂变得索然无味.教师通过多媒体教学课件,把文字、图
期刊
《英语课程标准》明确要求,初中学生的英语书面表达能力要能做到:能根据写作要求,收集、准备素材,独立起草短文、短信,使用常见的连接词表示顺序和逻辑关系;简单描述人物或事