上位作用特征基因的选择与分类方法研究

来源 :国防科技大学 | 被引量 : 8次 | 上传用户:gundamchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划测序工作的完成,生命科学的研究重点已经从确定DNA序列组成转移到了研究基因功能。复杂疾病易感基因,及其与疾病关联方式的确定,将有助于增进复杂疾病发病机理的理解,进而对复杂疾病的预防,诊断和治疗产生重大影响。尽管如基因芯片,高通量测序等新技术产生了海量的生物数据,但是由于数据本身所具有的特征基因维数高和上位作用等特点,使得对于复杂疾病的研究迟迟没有取得突破性的进展。因此如何对生物数据进行降维,同时保留其中的上位作用,并建模上位作用基因与复杂疾病的关系,成为了复杂疾病全基因组关联研究的热点。本文从以上两方面出发,提出了对包含上位作用的数据进行降维的方法和建模上位作用与疾病关系的方法,并提出了将这两种方法结合的先过滤后分类机制,实现在软件之中。总结起来,本文的主要工作和创新点如下:1.提出了一种基于动态样本选择的特征选择算法。ReliefF方法通过比较最近邻的特征取值差异与类别差异对特征进行评估,因为能够检测特征之间的相互作用,所以ReliefF及其改进方法被广泛应用于上位作用分析之中。但是ReliefF方法只是静态的评估特征在整个样本空间中的重要性,而没有考虑到未选中特征对于被已选中特征分类正确的样本来说是冗余的。为此本文提出了基于动态样本选择的ReliefF算法,动态的在被已选中的特征分类错误的样本空间中重新评估剩余特征的重要性,提高了ReliefF算法筛选上位作用基因的能力。2.提出了一种建模基因与疾病表型关系的分类算法。多因子降维方法通过比较所有单核苷酸多态(single nucleotide polymorphism, SNP)组合各个基因型与总体的对照病例比,将该基因型划分为高风险和低风险。由于对SNP组合进行穷举的特性,它只能局限于小规模数据的应用上。本文提出了基于禁忌搜索的多因子降维方法,利用禁忌搜索来代替穷举搜索。该方法主要对禁忌搜索框架从解的编码方案,初始解和邻域解生成,全局多样化搜索三个方面进行了适合上位作用分析的改造,解决了原始多因子降维方法无法推广到大规模数据分析中的问题。3.提出了先过滤后分类的检测上位作用机制,并将其实现在软件之中。通过将特征选择算法对特征的评分转换为分类算法生成解时选择SNP的概率,我们结合了之前的过滤器和分类器。结合之后的方法解决了分类器分类正确率相对较低的问题,同时进一步缩短了计算时间,更具有实用意义。
其他文献
现代化仪器设备的高速长期运转会导致仪器设备中出现缺陷,影响设备运行效率,甚至会产生安全事故,因此需要对设备的内部缺陷进行及时检测。本文将阵列换能器应用到超声检测中,利用有限元仿真的方法研究声波在固体介质中的传播特性,并且利用延时叠加算法实现对金属内部缺陷的定位成像。具体研究内容如下:(1)研究了声波在固体介质中的传播特性,对声波在固体中的波动方程进行简单的推导,并且研究了声波在异质界面处的传播特性
凝汽器是核电厂二回路重要核动力设备,主要功能是冷凝汽轮机排汽,在排汽口产生且保持合适的真空度。凝汽器是否安全平稳运行直接干扰汽轮机组工作效率,甚至影响二回路系统安全。本文以海南昌江核电站对分单流程表面式凝汽器为研究对象,对该凝汽器结构及工作过程进行了简化,在能量守恒、质量守恒的基础上按照其工作特性建立了集总参数模型。该模型考虑了不凝结气体与冷却管结垢对凝汽器换热过程的影响,同时也考虑了极端情况下凝
本文针对颗粒三维空间位置重建的权重矩阵计算耗时久、定义步骤繁琐等问题,提出一种易实现的改进型反演算法,满足精度要求的同时明显减少运算时间,节约器材成本,为光场相机结合显微装置定位更加微小的颗粒提供基础,具有良好实际应用价值。论文通过程序仿真及实验验证了改进型MART算法重建颗粒位置的可行性。论文研究工作和内容主要包括以下几个部分:(1)利用双平面参数法建立光线正向追迹模型,模拟不同位置颗粒的成像效
水产品加工与工农业生产、百姓生活等各领域关系密切,对经济建设、工业化发展等贡献巨大。随着人们对水产品需求的增加及相关工业化技术的提高,与之相应的分割要求也越来越严格。尤其在鱿鱼分割领域,由于众多企业现今基于人工分割有较多的局限性,急需新的突破。本课题在深入研究线激光扫描仪工作原理,结合工业自动化设备,设计了一种基于线激光的鱿鱼在线测量与分割系统。本文主要实现了鱿鱼分割装置的设计与测控系统的实现,对
数字全息是非接触式的高精度测量技术,是精密测量领域的一项重要研究内容。相对于传统全息而言,数字全息拥有对物体三维信息的记录分析能力,但由于记录过程中光电器件像元尺寸和光敏面积的限制,数字全息图的记录范围较小、分辨率低,严重限制了数字全息在大范围、高精密测量领域的应用。针对数字全息技术中测量面积受限的问题,本文提出基于优化Harris角点算法的拼接算法实现相位的双方向拼接。在获取数字全息图像时,保证
北斗卫星导航系统(Bei Dou Navigation Satellite System,BDS)是我国自主研制的重要空间信息基础设施,也是全球导航卫星系统(Global Navigation Satellite System,GNSS)的主要成员之一,它可向用户提供导航定位、授时、测速和短报文通信等功能。无论是在军事还是民用方面,BDS都发挥着巨大的、无可替代的作用。随着BDS逐步从北斗二号过渡
气体超声流量计作为一种非接触式仪表,具有高精度、低压损、耐磨和宽量程比等特点,广泛应用于天然气、石油化工和民用航空等领域的流量计量。气体超声换能器作为一种实现声电转换的传感器,是气体超声流量计中重要的传感部件,对气体超声流量计性能有着重要作用。一方面气体超声换能器之间的性能差异影响流量计的测量精度;另一方面气体超声换能之间的性能随温度、压力变化影响流量计的稳定性。目前对于气体超声换能器的一致性评价
许多重要的数学物理方程都可以表示为多辛Hamilton系统的形式,从而,对其数值算法的研究无疑具有非常重要的意义。多辛几何结构是多辛Hamilton系统的内在几何性质,这就要求此结构在数值离散时得到保持,我们称能够保持此离散多辛几何结构的算法为多辛算法。大量的数值结果表明多辛算法在长时间的数值模拟中相比于非多辛算法具有明显的优越性。本文对一些重要的一维和二维非线性波动方程的多辛算法进行了研究。主要
流量调节阀在冶金、化工以及其它工业流程中应用广泛,是重要的管道附件。在各类调节阀中,轴流式调节阀有调节比宽、调节平稳、对流动扰动小的特点,在有较高调节特性要求的应用中具有优势。本文通过理论分析、数值模拟和实验相结合的方法,对设计理论和设计方法展开讨论,开发新型气体轴流式等百分比流量调节阀,并对阀门流量调节特性和压力损失等进行研究,主要内容与结果如下:(1)轴流式调节阀设计方法和新型轴流阀结构设计。
作为制动防滑系统中防滑器的执行部件,防滑阀通过充气、保压和排气动作影响制动缸的压力大小,其各项性能的好坏直接极大地影响机车的制动和行车安全。针对国内防滑阀综合性能的研究较少,以及防滑阀单部件各项性能检测设备的操作复杂、测试功能不全面、成本高等问题,本文研究了防滑阀的工作原理和结构特征,建立了对应的数学和物理仿真模型,结合嵌入式技术,开发了一套基于嵌入式系统的防滑阀检测系统,完成对防滑阀的密封性、动