惩罚函数在基因关联分析中的应用研究

来源 :福建农林大学 | 被引量 : 0次 | 上传用户:gaofeinei3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和计算机的迅猛发展,各领域都产生了海量的数据,如生物学、计算机科学、金融学等诸多领域都存在种类繁多的复杂数据,因此,需要从大量的数据中提取有价值的信息进行分析。近年来,变量选择成为了统计学的研究热点,尤其是惩罚项正则化方法,其特征是通过惩罚函数进行变量选择,能够处理高维且存在共线性的数据。本文主要研究惩罚函数的变量选择的改进方法和在基因关联分析中的应用,在原有的惩罚函数模型的基础上考虑变量之间的网络结构关系,并将惩罚项正则化用于多因变量回归模型。本文的内容可分为两个部分,具体内容如下:1、在原有的惩罚函数模型上加入网络惩罚项本文中在单个变量选择的模型上,考虑了变量之间的网络结构关系。通过对四种不同类型的数据进行模拟研究,并以前列腺癌基因表达谱数据进行实例验证,分别比较基于网络结构的惩罚函数的变量选择模型和基于惩罚函数的变量选择模型的优劣性,结果表明:基于网络结构的惩罚函数模型较原有的惩罚函数模型更具有优越性和稳定性,尤其是基于MCP惩罚函数的网络结构模型有较高的预测能力,对于发现患有前列腺癌的病人有很大的帮助。2、将惩罚函数的变量选择方法应用于多因变量回归模型(1)本文详细介绍了基于协方差估计的多因变量回归模型,其原理是在似然函数上加入了惩罚项。通过计算机模拟研究基于协方差估计的多因变量回归模型在六种情况下的预测效果和变量选择效果,并在水稻DH群体的多性状QTL定位中,将基于协方差估计的多因变量回归模型与稀疏偏最小二乘法进行比较,研究表明基于协方差估计的多因变量回归模型在变量选择上有更佳的效果。(2)由于基于协方差估计的多因变量回归模型只能在解释变量小于样本量的情况下进行,本文提出一个基于高维数据的多因变量回归模型(即解释变量远大于样本量的情况)。通过计算机模拟分析该模型的预测和变量选择效果,并将基于高维数据的多因变量回归模型与稀疏偏最小二乘法都应用于高维的籼型杂交水稻的多性状QTL定位中,证实了基于高维数据的多因变量回归模型在变量选择和预测上都具有较好的结果。
其他文献
恐惧是一种当面临可能会对生存产生威胁的刺激时产生的情绪反应,而对危险性刺激产生迅速有效的应对是保障一个物种的生存和延续的关键。当动物认为该危险刺激源是可以控制或
死亡是人类永恒的思索。蒋韵小说的主人公常常以死亡退出叙事文本。求生是人的本能,而求死,在蒋韵笔下也是对生命的一种尊重。死亡不是生命的毁灭,而是向精神家园的回归。本
乳酸脱氢酶(1acticdehydrogenase,LDH)是一种糖酵解酶。广泛存在于人体组织内,以心、肾和骨骼肌含量最丰富,其次是肝、脾、胰及肺组织。正常人血清可测出此酶,在一些器官病变和恶性
<正> 在大型钢构件上所使用的紧固件(如螺栓、螺柱)近年来逐步向高强度方向发展。由于金属材料强度级别的提高(σ_b>100公斤/毫米~2),零件发生延滞断裂的威胁日愈增加。目前,
本文综述了国外有代表性的居家环境适老化评估工具,并对其适用性进行评判与比较,为我国居家环境适老化工具的开发和研制提供参考。
安徽外国语学院在应用型本科建设过程中,将学科专业竞赛活动植入外语专业人才培养方案,积极探索了外语人才培养新途径。通过对高校在实施专业竞赛活动中问题的对策研究及对安
马克思主义自由观,与历史唯物主义有着密不可分的关系。历史唯物主义奠定了马克思主义的基本观点,揭示了社会发展的一般规律。通过对自然与社会的一般规律的把握与运用,在实
非能动系统由于被认为能够有效地简化核电厂设计并提高安全性,而被广泛应用于新型反应堆的设计中。自然循环系统是一种重要的非能动系统,多用于反应堆余热排出。自然循环系统
目的探讨人性化护理干预在脊柱外科护理中的价值。方法选取我院收治的脊柱外科手术患者108例依据随机平均原则划分为对照组与研究组各54例。对照组54例患者采取常规护理,研究
介绍了Mallat算法,提出了将Mallat算法应用于多种混叠的振动信号的特征提取。建立了转子不对中模拟实验台,把采集到的支承振动信号进行Mallat分解和重构,重构后的信号能够有效地