【摘 要】
:
全基因组关联研究(Genome-Wide Association Study,GWAS)通常以单核苷酸多态性(Single Nucleotide Polymorphism,SNP)为标记分析复杂疾病的遗传易感性。然而由于基因数据具有
论文部分内容阅读
全基因组关联研究(Genome-Wide Association Study,GWAS)通常以单核苷酸多态性(Single Nucleotide Polymorphism,SNP)为标记分析复杂疾病的遗传易感性。然而由于基因数据具有样本数量小,数据维度高,数据噪声大等特点,通过传统实验的方式研究基因之间的交互关系比较耗时、费力,并且成本高昂,因此借助数据挖掘的相关技术准确的分析基因-基因的交互关系对于复杂疾病的病因探索或寻找易感基因有着重要意义。本文以基因-基因交互关系作为研究对象,针对目前基因-基因交互关系识别方法研究存在的不足,通过数据挖掘技术,提出一种新的交互关系识别算法。具体的研究内容为:(1)提出了基于支持向量机的基因交互关系识别算法SVMITER。为了避免多重比较问题中结果假阳性过高,本文首先根据支持向量机理论结合笛卡尔积算法思想,提出了基于支持向量机的属性组合迭代算法SVMITER。算法首先使用支持向量机对SNP进行初期的筛选,然后将筛选后的SNP使用笛卡尔积算法进行SNP属性的组合,接着将得到的SNP组合使用支持向量机进行模型构建,根据F-Measure值判断该模型是否是最佳模型,如果不是继续使用笛卡尔积算法进行更高阶SNP属性的组合,以此类推直到得到最佳预测模型为止。在模拟数据的实验中,首先进行了核函数选择和参数调优,接着使用了评估指标Precision、Recall和F-Measure值与三种数据挖掘算法BOOST、Random Forest和MDR进行对比实验,发现SVMITER算法性能最优。(2)基于SVMITER算法的低阶基因-基因交互关系识别。本文使用SVMITER方法针对低阶基因交互关系进行识别,分别采用模拟数据与真实数据两种数据集。通过与现有方法的比较和两个真实案例分析表明,SVMITER算法在模拟数据中识别性能POWER值比BOOST算法高,在真实数据中可以准确的识别出SNP组合rs380390和rs1329428等。(3)基于SVMITER算法的高阶基因-基因交互关系识别。在低阶基因交互关系的研究基础上,本文继续使用SVMITER方法针对高阶基因-基因交互关系问题进行分析研究,采用模拟数据与真实数据两种数据集。通过与现有方法的比较和案例分析表明,SVMITER算法在高阶模拟数据中可以识别出5阶SNP组合,识别性能POWER值依旧比BOOST算法高,在真实数据中准确的识别出已被发现的5阶SNP组合。
其他文献
目的:筛选单侧Pilon骨折术后踝关节功能的影响因素,为提高手术疗效提供参考依据。方法:选取2015年2月至2017年2月期间就诊于西南医科大学附属中医医院骨科、骨折前下肢正常、年龄18岁以上、Rüedi-Allg?wer(Ⅱ-Ⅲ)型、接受手术治疗、临床病历资料完整、随访12个月以上的Pilon骨折患者75例,通过Excel表格,采用双人双机平行录入、专人核对、及时备份等方式收集姓名、性别、年龄、
随着建筑行业工业化、生态化进程的不断深化,社会对于建筑废弃物循环使用的呼声越来越高。由于废弃混凝土的再生利用能同时解决垃圾堆放和资源循环利用两个问题,故对其研究已
模糊赋范线性空间理论是模糊分析学的重要组成部分,模糊赋范空间中的拓扑结构一直成为众多学者的关注热点.基于强模糊度量空间,本文对强模糊赋范空间中的模糊化拓扑进行了较
强关联电子系统的研究一直是凝聚态物理重要的前沿课题。由于电子之间的相互作用支配着强关联电子系统的主要性质,因此其表现出了很多不同于自由电子气体的性质,产生了很多新
本文主要是验证了在光子迁移理论的基础上得到的半经验模型。为了验证该模型的正确性,我们选择了不同的散射相函数,采用MC模拟得到了RΦ与μsΦ呈线性关系,其斜率是关于γ的的二次函数,从而验证了半经验模型的正确性。接下来我们又研究了影响半经验模型的影响因素,发现散射相函数、各向异性因子以及无量纲的约化散射系数都会对半经验模型造成不同程度的影响。这充分说明了二阶光学参数γ对生物组织微观结构的变化是相当敏感
本文对有关全极化合成孔径雷达极化校正、极化分解以及极化特征参数提取进行了详细的阐释,从物理背景到应用的了解、探索和挖掘的过程中,取得了一些创新性的成果。主要研究内
富含晶洞的花岗岩类,其成因类型目前依旧争议较大,争议点主要集中于A型与Most felsic I型之间,由于其岩石学特征及其地球化学特征具有很高的相似性,为成因类型的研究提出了很
目的:探讨关节镜下半月板部分切除与缝合治疗半月板损伤近期临床疗效,比较两种手术方式治疗半月板损伤后对患者膝关节功能的影响,对于半月板损伤后手术方式的选择提供一定的依据。方法:收集宜昌市第二人民医院骨科2016年9月至2018年3月期间半月板损伤病例100例,符合纳入标准的共有50例,分为半月板部分切除组和缝合组。以上两组手术均由本院同一名经验丰富、技术娴熟的医生进行关节镜手术,其中30名患者行半月
根据阶段发展论,初中一年级学生正处在人生八个阶段中的少年期,少年期正处在生理上迅速变化的时期,学生的身高迅速增长,体重增大,开始出现第二性征,但心理的发展水平滞后于生理发展水平。根据皮亚杰的认知发展观,12-15岁的初中一年级住宿生正处在形式运算阶段,他的理论是每个阶段都有其顺序,都是从低级到高级发展,如果这个阶段没有发展好,将会影响到下一个阶段的发展。跟走读生相比,住宿生群体引起了我的注意,初中
覆垄沟植技术已广泛应用于雨养农业中,但传统地膜覆盖易导致碎片化和土壤污染,为了探明一种可替代材料的可行性,在甘肃省定西市水土保持科学研究所安家沟流域气象园外开展了旱地双垄不同材料覆盖条件下土壤水分变化动态及水分利用效率研究试验。试验设有防草地布+地膜覆垄(MB)、防草地布覆垄(DB)和裸地起垄(CK)三种处理,分析了不同覆垄措施对土壤水分变化、作物产量以及水分利用效率的影响,探讨了防草地布替代塑料