【摘 要】
:
特征选择技术是当前信息领域,尤其是模式识别领域的研究热点之一。基因选择是特征选择中的一个应用。基因选择在疾病预测方面有非常重要的实际意义。现存的一些基因选择方法
论文部分内容阅读
特征选择技术是当前信息领域,尤其是模式识别领域的研究热点之一。基因选择是特征选择中的一个应用。基因选择在疾病预测方面有非常重要的实际意义。现存的一些基因选择方法能够有效地找出致病基因,但疾病往往都是由多个基因联合造成,而现存的方法却不能找到这些联合的致病基因,我们称之为基因集合。针对上述问题,本文介绍了一种新的基因选择的方法-基于频度与联合效应的基因选择。该方法的主要思想是:先利用Fisher准则,将关系紧密的基因组合在一起,形成一个个枝条,所有枝条构成一个枝条矩阵;再从这个枝条矩阵中找出频度最高(出现次数最多)且联合效应程度(多个基因联合起来对疾病的影响程度)最大的基因集合,即与疾病最相关的致病基因集合。本文方法最大的优势在于它能找到最本质的致病基因集合,特别适用于由多个致病基因联合造成的疾病。本文方法还可以用于其他特征选择问题,如语音辨识,人脸识别等。本文实验数据均是一些常见的真实数据集,通过使用本文方法得到的实验结果与以往一些特征选择方法,如:mRMR[1], SPCA[2], Ruck[3], Tarr[4]等进行比较,发现本文方法有很好的去噪效果,且能更有效的找到本质特征,降低特征空间维数。
其他文献
本文提出了基于LUT的FPGA的时序分析方法和后仿真的设计方案,并予以实现。时序分析和后仿真是在布局布线基础之上进行的,是FPGA支持软件系统不可缺少的两个步骤。在时序分析
近年来,随着语音识别理论研究的深入和数字信号处理软、硬件技术的发展,语音识别技术的研究越来越受到人们的关注。另外,嵌入式技术的发展,使嵌入式语音识别技术成为语音识别
本文基于计算机技术和生物学原理,以蛋白质序列中蕴含的生物信息分类为依据,对蛋白质中α类、β类、α+β类及α/β类中样本数量较多的27类折叠子类型进行识别研究,提出了一种基
低密度校验(LDPC)码是一类逼近香农限的编码,已成为当今信道编码领域的研究热点之一。利用组合设计构造的一些LDPC码具有循环或准循环结构,不仅性能接近随机构造的最优LDPC码
随着信息技术的发展和后PC时代的到来,嵌入式产品成为当今IT产业的重要需求之一,同时巨大的嵌入式应用也对嵌入式设备提出了更高的要求,用户也出原要求“能用”转变为用得舒适,便
传统的色彩校正技术基于ICC规范,使用基于三刺激值的色度色彩空间,这使得色彩匹配往往是同色异谱匹配,仅能在同一观察条件下实现色彩的一致再现,若观察环境改变则颜色不再匹
小波分析已经广泛应用于信号处理与分析中,并取得了较为突出的效果。但在高维情况下,小波分析并不能充分利用数据对象的几何特征。针对小波理论的这一局限,人们在小波理论的
进化计算是一种模拟生物进化过程与机制求解问题的自适应人工智能技术,是一类随机搜索技术。它们模拟由个体组成的群体的学习过程,其中每个个体表示给定问题搜索空间的一点。
SNP(Single-Nucleotide Polymorphism,单核苷酸多态)是一种新的遗传标记。它在人类遗传变异中非常普遍,几乎占到已知变异多态性的90%以上。对SNP研究是后基因时代生物信息学研究
在事务数据库中挖掘关联规则一直是数据挖掘的热点问题。Agrawal提出了经典的基于频繁项集的Apriori算法,算法产生规则是以交易数据的数据库内容为基础进行匹配。随着数据库