【摘 要】
:
对肿瘤基因表达谱数据集进行数据挖掘获取的有效基因信息对癌症治疗有重要意义。肿瘤基因表达谱数据集属于高维小样本数据集,含有大量冗余信息,难以直接用于分类。很多基于单种群进化算法的基因选择方法可以得到较高质量的基因子集,但在选择过程中仍存在关键基因未被选中,且算法易陷入局部最优的问题。因此,本文基于多群协同进化策略对单目标粒子群优化算法和多目标粒子群优化算法进行改进以实现基因选择,主要工作如下:(1)
论文部分内容阅读
对肿瘤基因表达谱数据集进行数据挖掘获取的有效基因信息对癌症治疗有重要意义。肿瘤基因表达谱数据集属于高维小样本数据集,含有大量冗余信息,难以直接用于分类。很多基于单种群进化算法的基因选择方法可以得到较高质量的基因子集,但在选择过程中仍存在关键基因未被选中,且算法易陷入局部最优的问题。因此,本文基于多群协同进化策略对单目标粒子群优化算法和多目标粒子群优化算法进行改进以实现基因选择,主要工作如下:(1)为降低基因选择方法中关键基因未被选中的概率,获取具有更好分类效果的基因子集,提出基于层次过滤和反向学习多群协同进化的基因选择方法(HF-MPPSOGS)。首先引入层次过滤策略替代单一指标过滤策略,降低基因表达谱数据预处理时关键基因未被选中概率。其次,使用反向学习初始化主群和辅群并分别进行局部开发和全局探索,当辅群发现更优位置时与主群进行信息交互,降低算法陷入局部最优概率并提升种群多样性。在多个基因表达谱数据集上验证出所提出的方法可以更精准的剔除冗余基因,选出与肿瘤种类更相关的基因子集。(2)为解决基于单目标优化的基因选择方法在目标选取上存在一定的倾向性导致难以得到最优解的问题,提出基于角度偏好多目标多群协同进化的基因选择方法(APMPMOPSO-GS)。首先,使用分类准确率和选中基因个数作为优化目标,初始化主、辅种群并置空各自外部存档,根据主群外部存档中非劣解的分布找到较稀疏区域作为偏好区域,辅群使用粒子与偏好区域的欧氏距离建立更严格的偏序关系,选出辅群领导粒子引导辅群向偏好区域探索。接下来,主群使用反向学习变异,并适时将主、辅群的外部存档合并进行帕累托排序,提升种群逃离局部最优的能力。在多个基因表达谱数据集上验证出所提出方法能选出冗余度较低且分类性能更优的基因子集。(3)设计并实现基于多目标多群协同进化基因选择方法的癌症诊断系统。采用Vue设计系统的操作界面,利用Java和Python实现系统的业务逻辑和核心算法。系统主要包括用户登录模块、数据管理模块和癌症诊断模块。该系统可以有效实现癌症诊断功能。
其他文献
光子晶体作为未来制作光传输、光存储和光转换相关光学元器件的基础介质材料,受到了研究者们的青睐和重视,光子拓扑学也一跃成为热点研究领域。光子晶体具有的独特性质,决定其在未来通信领域内将成为不可或缺的部分。光子晶体不仅拥有各维度上丰富的结构设计,其特有的拓扑边界态,还为人类控制光波提供了有效的解决途径。然而,拓扑边界态的激发依赖光量子自旋霍尔效应的产生。因此,若能在光子系统中激发量子自旋霍尔效应,便能
双边滤波器是一种典型的局部保边滤波算法,它能够很好的去除图像噪声而保持图像边界清晰。除此之外,双边滤波算法还可以扩展到图像处理的其他领域,例如,高范围动态成像(HDR),去雾等。该算法的提出,在图像处理领域具有里程碑式的意义。然而,双边滤波算法较低的运行效率,限制了它在图像领域的应用。时至今日,依旧有众多基于双边滤波算法的研究正在进行。研究的核心内容是在不损失图像质量的前提下,尽可能提高运行效率,
随着大数据时代的到来,人们越来越急需一种聚类算法来对大量的无标签数据进行处理,但我们往往面对的样本数据量较大,数据维度较高,采用传统的聚类算法不仅耗时长,而且聚类结果往往也不尽如人意。同时,聚类是一个迭代优化的过程,聚类过程中往往会受到噪声数据的干扰而导致聚类结果的性能较差。本论文针对上述的主要问题,主要从模型结构、损失函数、聚类算法、样本筛选等方面,研究了基于深度自编码器的三种新方法,具体的研究
DDIT3(DNA damage-inducible transcript 3),也被称为CHOP(C/EBP homologous protein),在内质网应激过程中促进细胞凋亡。通过对DDIT3的结构进行分析,发现其蛋白序列中有一段内在无序的低复杂序列(Intrinsically disordered region,IDR)。近年来的多项研究发现,许多带有IDR的蛋白能够通过该区域的相互作用
已知研究表明,COFU(CO-FACTOR WITH FVE)作为在拟南芥(Arabidopsis thaliana)中全新发现的转录因子,可与Ploycomb group家族中PRC2(Polycomb Repressive complex 2)成员FVE(FLOWERING LOCUS VE)互作,因此以FVE辅因子命名。但COFU的主要功能及作用原理仍未可知。本试验以拟南芥COFU缺失突变体
深色有隔内生真菌(Dark septate endophytes,DSE)是一类可定殖于植物根部并可形成深色有隔菌丝及微菌核的植物内生真菌,具有促进植物生长、提高植物抗逆性等生物学功能。DSE侵染植物后,与植物发生复杂的相互作用,引起植物miRNA表达的变化,但其作用机制尚不明确。越橘属(Vaccinium)植物常生活在酸性土壤中,易受到重金属的污染,如镉污染。此外,越橘对氮肥的利用效率较低,对不
图像边缘感知滤波是计算摄影中的一项重要技术,目的即执行滤波时感知并保持图像中的重要边缘特征,故又名保边滤波。根据计算方式的不同,传统边缘感知滤波可分为局部方法与全局方法。局部方法的输出可由局部邻域像素加权平均计算得到,全局方法将滤波视为优化问题建模并求解。多数现有局部方法计算效率高,但保边能力不足,易引入光晕等伪像。多数现有全局方法的保边滤波能力强,但因需求解复杂模型,计算成本高,甚至会引入强度偏
偶氮染料被广泛应用于印染行业,活性黑5(Reactive Black 5,RB5)是一种典型的偶氮染料,具有毒性强、难降解和致癌性等特点。沼泽红假单胞菌(Rhodopseudomonas palustris)营养类型丰富,适应性强,能够降解多种化合物,可以用于处理染料废水。沼泽红假单胞菌具备厌氧条件下降解染料的能力,也具有兼性条件下降解染料的能力。但其在微好氧条件下,无碳源存在对染料进行降解暂无报
人的BTF3(basic transcription factor 3)是一个具有双重身份的分子。一方面,BTF3属于新生肽链相关复合体(nascent polypeptide-associated complex,NAC)家族,该家族成员通过防止所结合蛋白的错误折叠来调节蛋白质的合成与降解。另一方面,BTF3也属于通用转录因子家族,可与RNA聚合酶II结合,调控基因转录,在细胞凋亡和增殖等过程中
近年来,移动视频业务在移动互联网业务中所占的比重越来越高,视频流量的爆发式增长给5G移动网络造成了巨大的挑战。为了保证移动用户侧更好的服务质量体验,要求移动网络提供更高的数据传输速率和更低的网络延迟。而现有5G承载网基于TCP/IP架构设计,采取以主机为中心的端到端通信模式,不具备泛在缓存能力,安全性和移动性支持也较差,难以有效支撑5G视频分发业务。为了从根本上解决基于传统5G承载网面向视频分发业