【摘 要】
:
基因选择是微阵列数据研究中的重要课题。从充满冗余信息和噪声的高维小样本的数据中选择与样本分类最相关的基因,有利于提高分类器对样本的分类准确率。本文在从微阵列数据中
论文部分内容阅读
基因选择是微阵列数据研究中的重要课题。从充满冗余信息和噪声的高维小样本的数据中选择与样本分类最相关的基因,有利于提高分类器对样本的分类准确率。本文在从微阵列数据中获取熵信息基础上,利用粒子群优化算法(PSO)结合极端学习机(ELM)进行基因选择。该类方法在基因选择过程中考虑问题中蕴含的先验信息使得选出的基因具有一定的可解释性,并提高了极端学习机对癌症微阵列数据的预测精度。本文主要工作如下:
(1)提出了一种耦合微阵列数据中各基因的判别熵信息结合粒子群优化和极端学习机的混合基因选择方法。该方法首先根据微阵列数据中各个基因的判别熵信息建立初选基因库,然后在初选库中通过粒子群优化算法搜索具有最高分类率的基因组合。该基因选择方法在基因选择过程中综合考虑每个基因对于分类所提供的信息度,使得所选基因具有很好的可解释性,并使得所选基因组有利于提高微阵列数据的分类准确率。在五个常用微阵列数据集上的实验结果验证了该方法的有效性。
(2)提出了一种将微阵列数据中基因组的最小熵信息(信息度)编码进粒子群优化算法进行基因选择方法。该方法将每个粒子所代表的的基因组合的信息度值作为该粒子的适应度函数值,通过粒子群的进化来获取最优基因子集。该方法更易于选出那些基因使得样本的类间距离较大而样本的类内距离较小,从而有利于实现样本分类。实验结果表明,该方法能够获取低冗余的信息基因,并在该方法选出的基因子集上,极端学习机获得优于经典方法的预测精度。
其他文献
由于电力线载波通信是利用电力线来传送信息,因而具有其它通信方式无法比拟的广泛性、经济性和牢固性的特点。目前,电力线载波通信作为通讯技术的一个新兴领域,有着很大的研究价
航空院校是航空科研教学的基地,是培养专业航空人才的摇篮。可当老师和同学们想要搜索查询最新的数据信息,往往只能通过普通的大众化的搜索,而这些搜索查询都存在着高覆盖率和低
红外热成像检测技术是一种新兴的无损检测技术,通过建立物体表面温度场与内部缺陷之间的联系,对物体内部缺陷进行检测、评价。与传统无损检测技术相比,它有着非接触、检测面
同步现象在科学,自然,工程和社会生活中大量存在。同步控制技术已被应用到涉及同步现象的许多领域,如伺服,机器人之间的合作,多轴机床的加工。这些应用领域中对同步控制精度
随着用电需求的增大,电网中感性用电设备对无功功率的需求也日益增大,被消耗的无功若不能及时的得到补偿,将会严重影响到电网的安全稳定运行,所以合理有效的进行无功补偿已成为节电降损、提高电能质量的关键所在。而现有的无功补偿装置普遍存在跟随性不强、投切有振荡有涌流、设备使用寿命短等问题,所以有必要对其进行进一步的研究,以期找到更合理的解决方案。在分析了传统补偿策略的基础上,系统结合了“九区图”控制和模糊控
污水监测与处理对环境保护和居民饮用水的安全保障起着重要作用。化学需氧量(COD)作为污水监测的重要指标,其检测方法从最初的实验室化学分析,发展到紫外法(UV法)快速在线监测。
视频监控系统对内河航运及监管都有着极为重要的作用。然而,内河有雾天数达全年的60%,雾、霾等天气因素严重影响了CCTV系统的监控。因此,深入研究内河图像和视频的去雾算法对
PID (PID-Proportion Integration Differentiation)控制是最早发展起来的、在实际工程应用中仍广泛采用的控制策略。PID控制具有控制算法简单、可靠性高、稳定性好、无静差,
控制系统校正是控制系统设计的重要环节,而目前工程技术界常用的设计方法是频域法。经典的频域设计步骤简单清晰,对于简单的校正装置设计是有效的,但当校正装置级数较多时,操