基于成分数据的线性回归模型的应用

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:Q529801428
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在微生物分析中,一个重要的研究方向是识别出哪些细菌群对所要研究的问题起到影响作用。微生物数据是典型的成分数据类型,并且细菌微生物具有不同层次的分类类别。本文的主要目的是将介绍的成分数据线性回归模型应用于厌氧发酵过程中,分析出哪些厌氧发酵菌对沼气的产量起到显著的影响作用,进而可以在厌氧发酵产生沼气的过程中对识别出的细菌进行一定的实验操作,这样会对沼气的产量起到提升作用。本文首先介绍了成分数据基本概念、坐标下降法、增广拉格朗日法以及lasso估计法等建立以及应用成分数据线性回归模型的必需理论知识。之后介绍了成分数据的变量选择模型,新建立的模型的参数求解是在lasso估计法的基础上建立的,并且对参数增加了零和限制,进一步运用坐标下降法和增广拉格朗日法相结合的方法对模型进行计算。并对介绍的proposed method选取参数进行了数值模拟,对模型分别进行了凸优化工具箱CVX法和坐标下降法的方法进行了数值模拟,每一种方法与一般的lasso估计法进行了比较,发现在PE,l1loss,l2loss,lnlloss,FP,TP六种参数表现方面,proposed method比一般的lasso估计法效果好。并且,通过对两种方法的比较,发现当数据是高维时,用后者方法计算的精度更高,误差更小。但是,当p>>2n时,两种方法的误差相差不多,但是CVX方法计算速度更快。然后,在之前建立选择模型的基础上,因为微生物细菌具有不同的分类类别,所以需要考虑到微生物子成分的一致性,进而介绍了适用于一般情况下的成分数据线性回归模型。因为由模型计算得到的参数估计是有偏的,所以进一步对参数的无偏估计和置信区间的计算方法进行了介绍,最后设置参数对模型的效果进行了数值模拟。分别进行了置信区间的估计和置信区间下的变量选择效果的数值模拟,从模拟结果中可以得到,介绍的模型无论在变量选择方面还是置信区间的估计方面表现的都比一般模型要好。况且,TPR和FPR的数值表现都比较优异。最后将建立的模型应用到厌氧发酵过程中,选取细菌分类中的目类类别厌氧发酵菌为基本数据单位,在成分和子成分的研究应用中,进行了参数估计、变量选择、无偏估计、置信区间计算等过程。最后,识别出Gammaproteobacteria和Mollicates两类纲类细菌在厌氧发酵过程中对沼气的产量有影响,而且发现这两个细菌群中前者对沼气产量起到促进作用,而后者对沼气产量起到抑制作用。
其他文献
目的通过探讨成年糖尿病患者糖尿病初次被诊断的情境方式、糖尿病患者关于糖尿病防治的相关知识、态度和行为(KAP),糖尿病患者获取和利用糖尿病健康信息所选择的途径现状和内
随着微型尺寸产品在各领域的需求增加,微细零部件的加工受到越来越多的关注,微细电解电火花复合加工因无需考虑材料的硬度、强度和导电性而在微细加工中得到了广泛应用。本文
随着我国经济的发展,居民收入水平不断提高,消费支出范围不断扩大,消费结构不断调整变化,消费水平相应提高,居民的消费意识、消费理念、消费习惯等也都随之不断变化,由节制消费向消费主义发展。居民消费不再一味的“量入为出”,“提前消费”得到认可和接受,随之而来的是对消费信贷需求的不断增加。作为消费信贷业务的一种,信用卡业务在近年来也得到了高速发展。随着互联网技术和移动设备的发展,居民消费支付方式得到了丰富
随着国民经济的快速发展,人们对电能的要求也在逐步提高,不仅要求电能可以充足供应,还要求它具有较高的质量。由于新能源能弥补传统能源的不足,使其日益成为未来能源发展的主
随着工业4.0和互联网+浪潮对全球经济冲击的不断升级,中国制造业正处于随时可能被颠覆的风口浪尖,企业经营如履薄冰,找到本行业痛点、突破自我成为传统制造企业成功转型之关
风力发电技术是解决能源、环境等问题的重要手段,在当今世界提倡环保和可持续的大背景下得到了广泛的重视。由于直驱式风机取消了齿轮箱等易损机构,且永磁同步电机能量密度高
气候变化已对农业生产和水资源消耗产生重要影响,合理评估未来气候情景下区域农业用水的演变过程和特征能够为区域水资源管理和应对气候变化提供依据。水足迹理论有助于我们
目的本研究旨在通过对天津市成人居民进行营养与慢性病监测,收集膳食调查和慢性病患病情况等数据,分析代谢综合征(Metabolic Syndrome,MS)的流行特征及危险因素,运用膳食平衡指数(Diet Balance Index,DBI)评价天津市成人膳食质量,并探讨代谢综合征与膳食平衡指数评分之间的联系,为预防代谢综合征提供理论数据,并为代谢综合征者提供相关的膳食建议。方法本研究依托天津地区20
城市排水管网系统作为重要的城市基础设施,保障着城市道路排水安全,肩负内涝防汛等骨干作用,但排水管网因硫化物产生而导致的腐蚀恶臭问题是全球各个国家都共同面临的严峻挑
MOX(Mixed oxide)乏燃料主要由锕系氧化物和少量裂片元素氧化物组成,乏燃料的处理最主要的目的就是回收乏燃料中的锕系元素。锕系氧化物中的在高温熔盐中的溶解度较小,分离步骤较为复杂,本文以铀氧化物作为锕系氧化物的代表,研究了氧化铀(U_3O_8和UO_3)与裂变元素氧化物在Na OH熔体中的溶解性,为进行分离回收铀氧化物提供理论基础。主要研究如下:(1).在723 K~973 K温度范围内