基于时间序列数据的微生物关联预测方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:wangluochg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微生物对生态环境、人类健康等方面起着重要的作用,探索人类与微生物之间的复杂关系以及微生物与微生物之间的复杂关系是至关重要的,而通过微生物组时间序列数据推断微生物关联网络是探索微生物之间、微生物与人类疾病之间复杂关系的一个重要环节。随着高通量测序技术的进步,产生了大量描述微生物动态过程的高维时间序列数据,从时间序列数据中构造微生物相互作用网络可以捕捉不同微生物之间或微生物与环境之间的动态关系。本文从最大熵模型和向量自回归模型出发,研究了基于微生物时间序列数据的动态交互网络预测算法,主要工作如下:第一,提出了一种基于Chao-Shen熵推断微生物交互的无参数模型。该模型建立在联合熵公式的基础上,以单变量熵和双变量互信息为约束条件,通过线性优化联合熵得到条件信息熵,从而推断微生物之间的成对关联关系。为了能够在高维数据中进行熵的估计,在最大熵模型中引入了 Chao-Shen熵估计方法。在抗生素扰动的肠道微生物时间序列样本数据上,与其他熵估计方法进行对比,验证了最大熵模型结合Chao-Shen算法的推断性能。第二,提出了一种利用图全局和局部信息的向量自回归图正则化方法推断微生物之间的交互网络。基于Laplacian矩阵的图正则化向量自回归模型只考虑了图的全局信息,但忽略了图的局部信息。本文引入了一种结合Laplacian矩阵和Vicus矩阵的正则化方法——LG-VAR模型,其中Laplacian矩阵可以捕捉网络中的全局结构,而Vicus矩阵可以捕捉网络中的局部结构,两种矩阵相结合的正则化方法更准确地模拟了微生物之间的动态交互网络。与Lasso、弹性网以及Laplacian等几种已有的正则化方法对比,结果表明LG-VAR模型的表现更好。本文改进的两种模型都适用于高维微生物数据,一个为无参数模型,另一个为参数模型,实验结果表明这两种模型在微生物动态关联研究上具有一定价值和意义,为基于微生物时间序列数据推断动态交互网络提供了新的思路。
其他文献
本人博士论文研究题目是《15世纪文献<凯旋书>(Zefernāme)的词法研究》,此文献又称《帖木儿武功记》(Zefernāme-i Temür),是记述帖木儿帝国征战的历史著作,是一部从波斯文翻译而成的察哈台文译本,收藏于瑞典隆德大学图书馆,是瑞典著名突厥学家G.雅林(Gunnar Jarring)的收藏品之一。G.雅林(Gunnar Jarring)对这部文献的名字,作者,文献的尺寸等内容都有
学位
数学教材是培育学生数学核心素养的基础.教材的编写内容和方式对于教师和学生都颇具启发性.通过文献综述可见,国际之间不同版本的数学教材的比较文献数量呈现逐年上升的趋势,但在立体几何这一内容领域的比较研究相对较少,尤其是对三个不同国家不同版本教材之间的横向比较更是匮乏,考虑到中、美、俄三国在数学教育上颇具特色,因此最终选取三国的三版特色教材(简称CH-PEP、AM-MHG和RU-MEP版)进行横向比较.
学位
数学建模素养是能直接体现学生将数学与现实生活相联系的能力。要让学生真正的实现“会用数学的眼光观察世界,会用数学的思维思考世界,会用数学的语言表达世界”,培养并提高学生的数学建模素养是迫切需要的。已有的理论显示学习者在数学建模过程中的监控对问题解决的有效性起着不可忽视的必需作用,包括“信息的整合”、“参数的设定”、“模型的检验”等均需要学习者的不断调整和控制。本研究意在研究高中生自我监控能力与数学建
学位
“伴生课堂模式”是一种将信息技术融合于课堂的教学模式。它基于幸福教育的理念,旨在将传统的“老师教,学生学”转化为“师生共研”的课堂形式,使学生在学习的过程中获得幸福。“伴生课堂”教学模式植根于翻转课堂,保留了翻转课堂课前自主学习的形式,并对课堂教学的环节做出了详细说明,使教师在教学时步骤明确,实践性强。Aischool云平台为“伴生课堂”教学模式提供了学生课前自主学习的工具,并在课堂帮助师生实现交
学位
数学是一门以思维为基础的学科,良好的思维发展是提升学生数学学业成绩的关键前提与保障。在数学学习过程中,个体的思维水平决定了学生的思考方式、学习方法的选择、对知识结构系统化以及分析问题、解决问题等能力的高低。尤其是数学批判性思维的发展,本质上决定了学生看问题的视角以及把握知识本质的洞察力。另一方面,数学学习策略的合理运用也会对学生思维的发展存在重要促进影响,从而为数学学习能力的提升奠基。从已有研究来
学位
信息技术的发展推动了国家数字化转型,国家语委作为保障国家语言文字事业发展和改革的重要组织机构,正加快推进信息化工作进程。国家语委的日常工作业务主要包括项目立项、课题规划、管理审核、结项鉴定等内容。随着科研项目申报数量的与日俱增,国家语委面临着日益繁重的科研项目管理工作。针对当前国家语委科研申报管理工作信息化程度不足的问题,迫切需要设计和实现一个符合国家语委科研工作的申报管理信息系统。本文的研究工作
学位
敦煌醫藥文獻中的俗字、俗語詞等反映了唐五代時期敦煌地區的語言文字使用的真實面貌,但目前學界缺少對這些字、詞的斷代研究。本文以敦煌文獻中的醫藥文獻為研究材料,將俗字和俗語詞作為主要研究對象,綜合利用歷代醫藥文獻、字書和方言材料等,探討敦煌醫藥文獻中的字形釋讀和詞義訓釋問題。全文分為緒論、上下編、結語三大部分。“緒論”部分介紹了敦煌和敦煌醫藥文獻的概貌,梳理了敦煌醫藥文獻研究的現狀及其不足,並介紹了本
学位
随着社会的进步和计算机行业的快速发展,软件系统被广泛应用于社会的各个领域,并且极大丰富和改善了现代生活。软件本质上是一个具有竞争性和千变万化的业务,随着市场、硬件和软件平台的变化而迅速变化,客户对软件质量的要求也逐渐提高,与此同时,由于软件系统的复杂性,缺陷是不可避免的,因此软件测试变得至关重要。为了提高软件测试的效率,软件缺陷预测技术应运而生,该技术可以识别出软件中易出现缺陷的文件,有助于指导资
学位
近15年来,我国竞技健美操在国际赛事中大放异彩,三人操和五人操更是在每一届世界大赛中名列前茅。但是我国混双项目并不理想,只在第十四届世锦赛中取得季军,第十五届世锦赛中取得第八名。究其原因,我国混双项目在艺术评分方面得分较低。然而,在国际赛事中欧洲混双选手经常以出色的艺术编排取得傲人成绩。故本文以《FIG2017-2020竞技健美操规则》为依据,运用文献资料法、录像观察法、数理统计法、比较分析法等研
学位
随着科研领域的不断探索以及通信环境的变化,出现了一类具有通信链路间歇性连接、高时延以及高误码率等特点的特殊网络,被称为容迟网络(Delay Tolerant Networks,DTN)。DTN的概念最早源于星际网络,主要用于应对间歇性连接、拓扑结构动态变化以及网络资源匮乏等极端环境。不同于传统的Internet,容迟网络中发送节点和接收节点之间在通常情况下不存在稳定的端到端传输路径,因此现有的TC
学位