微阵列基因表达数据的特征选取分类研究与孤立点检测分析

来源 :华东理工大学 | 被引量 : 0次 | 上传用户：wjlwny110

【摘要】

：

DNA微阵列(基因芯片)技术的出现，使人们能够获得高通量的基因表达数据，这将成为今后重要的生物医学研究工具。但微阵列数据具有小样本、高维度的特点，这给数据分析带来了困难，从

【作者】

：

余伟峰

【机构】

：

华东理工大学

【出处】

：

华东理工大学

【发表日期】

：

2006年期

【关键词】

：

微阵列数据基因表达特征选取孤立点检测数据挖掘

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

DNA微阵列(基因芯片)技术的出现，使人们能够获得高通量的基因表达数据，这将成为今后重要的生物医学研究工具。但微阵列数据具有小样本、高维度的特点，这给数据分析带来了困难，从中挑选主基因即进行特征选取是十分重要和有意义的。在数据挖掘中，孤立点检测有着重要意义，可以用来发现数据集中小部分对象，以提高数据质量或发掘含有重要信息的数据单元，对于微阵列数据进行孤立点检测是十分有必要的。在特征选取分类方面，本文使用遗传算法挑选主基因，其中用k最邻近方法作为模式识别方法，使用支持向量机构建一个分类器，运用不同核函数进行预测分类性能测试。通过实验，在经典的白血病微阵列数据集上，对于34个样本的测试集，达到了100﹪的分类准确率，表明本系统对于该基因表达数据具有很好的分类识别能力。在孤立点检测方面，本文提出一种新的基于KNN图的孤立点检测方法——“两阶段法”。通过实验，该方法在模拟高维数据、真实低维数据(NBA数据)和真实高维数据(微阵列结肠数据)中表现良好，对于结肠基因表达数据检测得到的6个孤立点具有一定的代表性，表明本方法能够有效地检测孤立点，并且适用于高维微阵列数据分析。

其他文献

北京·埃森焊接与切割展览会——服务于心再创辉煌

第十八届北京·埃森焊接与切割展览会将于6月18~21日在上海新国际博览中心举办。北京·埃森展览是世界两大焊接展之一,其参展商来自30个国家和地区,观众来自全球近80个国家和

期刊

埃森焊接界专业人员便捷化产业论坛专业杂志组织方案焊接学会预登记等待时间

油田开发二层规划模型及其应用研究

目前，我国大部分油田已进入开发中后期，它们面临很多非常重要的问题，如技术、经济、政治等方面的问题。而石油是不可再生能源，石油企业在这些因素的影响下，如何保持稳产和可持续发

学位

油田开发人工神经网络二层规划模型模拟退火算法遗传算法

微分动力系统中的控制分解

本文研究微分动力系统中的控制分解。具体地，研究控制分解、同宿切现象、稳定和不稳定子空间之间的夹角三者之间的关系。我们证明了，给定C微分同胚f，给定正整数i，如果对于所

学位

微分动力系统控制分解同宿切现象小角现象

《痕迹》

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

本原矩阵的本原指数

在本原矩阵的研究中，对指数γ(A)的估计和指数集En的刻划这两个问题引起了不少人的兴趣.Wielandt[1]在1950年首先给出了n阶本原矩阵的一般性上界γ(A)≤(n-1)2+1，于是En(∈){1，2

学位

对称本原矩阵本原指数对角元竞赛图指数集分布规律

“对话世界——许鸿飞雕塑13站世界巡展”载誉归来后又将启程

2013年3月28日，“平民史诗——许鸿飞雕塑展”在中国美术馆拉开帷幕。许鸿飞精心创作的56件“肥女”雕塑，为参观者献上了一道丰厚的视觉审美大餐。许鸿飞的世界巡展以此为起点拉开了序幕，许鸿飞在不到2年时间内带着他的展览相继走过了澳洲、意大利、法国、英国、新加坡等地共12站。世界各地的展览中均取得了成功。“12”在中国是一个轮回数字，因此，踏入第13站，他选择了回到北京。　　2015年1月5日，许鸿

期刊

平民史诗中国美术馆雕塑公园雕塑展入第Exhibition视觉审美美术馆馆长广东美术馆罗一平

资本半方差的风险计量模型及在项目投资和组合选择中的应用

风险测度理论是经济学和金融学的基础理论。风险的正确计量是正确决策的前提；度量方式的简洁和计算方便是风险计量模型广泛应用的重要条件。在资本投资市场，根据其特性，用资本半

学位

资本半方差随机优势投资决策资产组合风险计量

特殊图的强控制数和反符号控制数

图的控制理论是图论中的重要研究领域.它不但有着古老的历史，而且在现今的图论研究中依然相当活跃.本文的研究对象是树的强控制数和n·Cm反符号控制数.　　树，作为连通图中最简

学位

图论树结构强控制数反符号控制数

巧用多媒体感受古诗美

古诗词教学是初中语文的重要内容之一,但是很多学生不愿意上古诗词课,因为很多课堂都是老师串讲一下,然后学生们背一背,课堂变得索然无味.教师通过多媒体教学课件,把文字、图

期刊

引导学生形成英语书面表达能力的五项操作要件

《英语课程标准》明确要求,初中学生的英语书面表达能力要能做到:能根据写作要求,收集、准备素材,独立起草短文、短信,使用常见的连接词表示顺序和逻辑关系;简单描述人物或事

期刊

引导学生英语书面表达能力初中学生英语课程标准英语基础知识教师英语句子训练写作要求逻辑关系教学计划初中阶段操作说明组织中考图示素材

微阵列基因表达数据的特征选取分类研究与孤立点检测分析

与本文相关的学术论文