疾病与微生物关联预测方法研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:calmisen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微生物是一切微小生物的统称,近年来,越来越多的研究证明微生物在人类健康、免疫防御、癌症控制、营养吸收中发挥着重要的作用,鉴定与疾病相关的微生物将有助于人们对复杂疾病发病机理的理解,同时也能促进相关药物开发用于疾病预防、诊断和治疗。然而用生物实验方法鉴定疾病与微生物关联不仅昂贵而且耗时。因此,利用目前已知的微生物-疾病关联数据,通过开发有效计算模型来识别潜在疾病相关的微生物将极大的降低实验成本,从而缩短实验周期。本文提出了两种算法模型预微生物与疾病之间潜在的关联。这两种模型分别是基于KATZ模型和二分网络推荐的微生物-疾病关联预测方法(KATZ model and Bipartite Network Recommendation Algorithm,KATZBNRA)和基于线性模型的微生物-疾病关联预测方法(Linear Model for Microbe and Disease Association,LMMDA)。两种方法都用到微生物-疾病关联网络、微生物相似性网络和疾病相似性网络。KATZBNRA结合了二分网络推荐算法和KATZ模型,首先利用二分网络推荐算法计算出推荐分数矩阵,然后将推荐分数矩阵与疾病相似性矩阵和微生物相似性矩阵整合,构建了疾病与微生物的异构网络,最后在异构网络上使用KATZ模型,实现微生物-疾病关联的预测。LMMDA将已知关联的微生物-疾病数据与疾病相似性矩阵和微生物相似性矩阵整合在一起,利用线性模型计算出关联分数矩阵,再用网络投影算法对关联分数矩阵进一步优化,从而实现微生物-疾病关联的预测。这两种方法都采用留一交叉验证、五折交叉验证和二折交叉验证对算法性能进行了评估,同时也对算法中的重要参数进行了交叉验证,并用AUC(Area Under Curve)值来验证他们的预测效果,其中KATZBNRA的留一交叉验证、五折交叉验证和二折交叉验证的AUC值分别为0.9098、0.8972、0.8463,LMMDA的留一交叉验证、五折交叉验证和二折交叉验证AUC值分别为0.8923、0.8897、0.8763,结果表明这两个方法的预测结果有较高的可信度。同时文本还对某些具体的疾病做了案例分析,进一步评估算法的准确度。
其他文献
本文在SOC可重用设计方法学的理论基础上,提出了基于IP核的可视化设计方法。该设计方法包括可视化IP核管理、可视化IP核调用、可视化IP核配置和可视化模块连接,同时提出了IP
河口沙洲是重要的湿地资源,对于沙洲面积的估算及其演变一直是人们关心的问题。但由于河口地区复杂的动力因素,海洋测绘难以获取河口沙洲Om线海图基面,并且耗时较长、花费昂
现如今,伴随着移动互联网技术的快速发展,计算机高速运行极大地提高了计算、逻辑判断和存储功能等方面的能力。面对电子商务和互联网金融等领域产生的大量数据,在“人工智能
研究癌细胞系对抗癌药物的反应是理解癌症生物学和研发新型抗癌疗法的关键,在癌症治疗中起着至关重要的作用。传统的研究癌细胞系-药物反应方法是基于临床实验的,这是一个时
高效能开展“三助”工作,需要对“三助”岗位进行科学的定位,最重要的是建立完善的管理制度和办法,不仅可以帮助“三助”工作的实施,而且还能节约资源、提高效率。本文运用问
随着语义网技术的不断发展和应用,大规模RDF数据集的使用也越来越频繁,在管理这些大规模数据集时,由于RDF数据集的体积问题,查询和管理的性能会受到很大影响。因此,对于大规
众所周知,除了分子本身的共振之外,表面等离子体共振(SPR)和电荷转移共振(CT)被认为是表面增强拉曼散射(SERS)信号被极大增强的两个最重要的来源。SPR和CT对SERS效应的贡献,通常被
复杂网络广泛存在于人们的生产生活中,该领域研究的一个重要方向是对网络社区结构的划分和演化分析,它有助于认知复杂网络的结构和功能,并对诸如广告投放、信息传播管理、个
窄流道结构紧凑,流道内沸腾两相流动具有较大的换热系数,目前被广泛应用于先进核反应堆的堆芯设计。沸腾两相流动伴随着的汽泡动力学行为极其复杂;窄流道内汽泡生长到与流道
随着大数据时代的到来,用图来表示数据成为越来越常见的形式,图聚类也成为了数据挖掘的重要技术手段。传统的图聚类技术主要是静态图聚类技术,即没有特别关注图结构动态变化