基于神经网络的微阵列基因芯片数据分析

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:aigeng87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微阵列技术的到来将对生物学和医学产生一场革命,通过它可以同时观测成千上万个基因的表达水平,从而能够在基因组水平上以系统的、全局的观念去研究生命现象及其本质。微阵列基因表达数据已经应用到肿瘤分型、肿瘤分类、基因功能研究、基因之间调控网络构建以及药物靶位识别等许多方面,对表达谱数据的分析已成为生物信息学研究的焦点。本文主要研究基于基因表达数据的数据分析方法,并针对已有的算法与模型当中所存在的问题,提出对算法的改进。 本文在介绍了微阵列数据原理的基础上,首先介绍了数据预处理和特征提取过程,之后讨论了两个紧密相关的应用领域:肿瘤分类和聚类。在肿瘤分类中,主要研究了基于BP神经网络的方法和基于支撑向量机(SupportVectorMachine,SVM)用于多类别分类的方法。实验结果表明,BP网络设计适当的情况下能够得到很好的分类结果,识别率高。而用两类支撑向量机构造多类别分类器,应用到14个类别的基因表达数据中,取得了较好的实验效果,同时与KNN方法进行比较,可以看出基于SVM构成的分类系统尤其适合于多类别的基因表达谱数据集分类。在基于SVM的方法用于多类别问题中,对比了两种构造方法OnevsAll(OVA)以及AllPairs(AP)的结果,两种结合方法中OVA方法的识别率优越于其他方法,性能稳定。分类性能均达到或超过了公开发表的实验结果。 在研究组织样本的聚类分析过程中,实现并对比了以下几种方法:层次聚类法、k均值法,同时本文采用了一种非常新颖的自组织特征映射神经网络的改进模型-DoubleSelf-OrganizingMap(DSOM)方法。实验证明DSOM网络应用到癌症基因表达谱数据分析中是很有效和可靠的,而且此方法具有可视化的优点,将高维的数据投射到二维平面上,更清楚地观测到聚类效果。聚类结果可以辅助病理学家进行进一步的有关肿瘤诊断和治疗。
其他文献
全球化和信息化正在使企业环境发生质的变化,而动态联盟的出现,对传统的管理系统、控制方式、组织结构和决策准则提出了新的要求。 Agent本身具有自治性、社会性、反应性
本文的研究内容主要集中在两部分内容上,一是伪随机序列随机性评估指标—线性复杂度的研究,得到了三个有用的结论;二是基于S盒的流密码设计,提出了一种高安全强度S盒的设计方
自20世纪后半叶以来,基于天线阵列的无线电测向技术得到迅速的发展,在无线电频谱管理、航空航天和军事通信对抗等民用和军事领域发挥着目益重要的作用。 本文对阵列无线电测
正交频分复用(OFDM)是一种并行的多载波传输方案,它利用相互正交的多个子载波来传输信息,具有较高的频谱利用率和良好的抗多径干扰能力,适用于高速率和多媒体数据传输,被认为
学位
近年来,随着我国经济的高速发展和商业活动的日趋频繁,货币的发行流通量逐年增大,点钞机在银行的日常业务中变得不可或缺。而目前市场上的点钞机多以钞票尺寸检测来识别票面面额,对不同版本纸币的兼容不够理想,因此对不同版本不同面额纸币进行自由混点存在一定制约。普通的点钞机可以实现相同版本相同面额纸币的清点并具有“磁性”、“紫光”和“红外”等一般鉴伪功能。本文在此基础上提出了一种基于图像识别技术的智能点钞机的
接入网是整个电信网最具有技术挑战性的区域之一。为了满足用户对带宽日益增长的要求,实现接入网的高速化、宽带化和智能化,各种接入技术层出不穷,如LAN、xDSL、Cable Modem
在现代通信系统中,高效快速的编码算法的研究已经成为视频图像传输的关键技术,是业界极为关注的热点课题。通过设计高效快速编码算法来实现视频码流的实时传输有着重要的工程
随着Internet的日益发展与扩大,基于Internet技术的各种应用快速发展。其中IPPhone就是近些年来兴起的实用技术。IPPhone又称VoIP(Voice over IP)或Internet电话,可实现语音,