基于基因表达谱的疾病亚型特征基因挖掘算法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zgrmxm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在本文中,我们对于基因表达谱数据的特点进行了研究,根据基因表达谱数据的特点提出了表达谱数据噪声过滤、数值规范化两个方法;然后对于k-means聚类方法在表达谱数据上的应用进行了深入的研究,并提出了一种确定分类数目的方法;结合以上的方法,我们提出了一种基于基因表达谱的疾病亚型的特征基因挖掘方法,其中,我们提出了一个衡量特征基冈对疾病亚型鉴别能力的测度:模式质量.该特征基因挖掘方法基于规范化和过滤后的基因表达谱,融合了k-means聚类识别疾病亚型技术和提出的衡量特征基因对疾病亚型鉴别能力的模式质量测度,实现特征基因挖掘.最后将提出的方法应用于40例结肠癌组织中2000个基因的表达谱实验数据,并将结果可视化,通过特征提取前后模式质量的比较以及可视化的结果显示:提出的方法是一种可行的疾病亚型特征基因挖掘方法,方法的优势在于可并行实现疾病亚型划分和特征基因识别.
其他文献
本文提出了植入式故障注入这个概念,并对植入式故障的引入技术作了系统化的研究.在文中,首先讨论了数字系统中的故障类型和发生机理.接着研究了各种硬件故障注入技术,基于对
随着计算机网络技术的迅速发展,针对主机以及网络的入侵行为日益猖獗。计算机和网络系统的安全问题越来越突出,各种安全手段的研究也就越来越重要,相应的,处于重要地位的入侵检测
三维地震数据场的传统解释方法是用剖面及水平切片显示二维图像,具有很大的局限性,很早以前人们就指出三维数据三维解释的方向。科学计算可视化是实现三维数据三维解释的主要
高速发展的DSP技术为语音信号处理提供强有力的工具,使得实时实现各种各样的复杂算法成为可能。针对不同的应用,国际标准组织制定了一系列的语音压缩编码标准。其中,G.729A是
随着社会的日益信息化,人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个富有挑战性的课题,是新一代计算机的三大突破口之一,正受到世界各国
在工业现场环境下将无线通信技术与Internet结合,为测控系统提供实时、可靠的远程数据传输服务,最为关键的问题是对TCP/IP协议进行实时性改进以及针对工业无线信道特征设计出
近年来,随着电子商务和计算机技术的发展,把智能计算技术和数据挖掘技术应用到电子商务,解决现有电子商务技术在个性化服务及商品信息推荐等方面的种种不足。目前的Web个性化服
本论文讨论了如何在P2P系统中通过发掘、利用资源特征,来实现基于内容的文本检索。 各类文本文件是P2P文件共享系统中共享文件的重要组成部分。作为知识的直接来源,文本文件
随着互联网的发展,计算机犯罪活动越来越猖獗,防火墙和IDS 在一定程度遏制了黑客入侵,但是高明的入侵者防不胜防,作为主动防御技术的计算机取证技术的出现弥补了传统网络安全
随着计算机技术的迅速发展,企业越来越依赖于计算机系统和网络技术,需要企业服务器为客户连续的提供服务。高可用性(HighAvailability,HA)越来越受到人们的重视。尤其近年来,全球