【摘 要】
:
条件独立图模型是一种刻画随机变量之间条件相关关系的方法,具有可解释性强以及易于可视化等优点,是网络分析的常用工具,具有较为重要的研究意义。然而,随着信息技术和数据存储技术的发展,可能存在不同来源或形式的数据集皆能对同组变量的条件独立图的结构进行估计。这些数据集具有差异性,无法简单合并,但是,如果仅利用单一数据集进行建模,那么利用不同数据集得到的条件独立图的结构可能并不一致,同时,也忽视了数据集间的
论文部分内容阅读
条件独立图模型是一种刻画随机变量之间条件相关关系的方法,具有可解释性强以及易于可视化等优点,是网络分析的常用工具,具有较为重要的研究意义。然而,随着信息技术和数据存储技术的发展,可能存在不同来源或形式的数据集皆能对同组变量的条件独立图的结构进行估计。这些数据集具有差异性,无法简单合并,但是,如果仅利用单一数据集进行建模,那么利用不同数据集得到的条件独立图的结构可能并不一致,同时,也忽视了数据集间的关联性,造成了信息的损失。而整合分析旨在综合不同数据集,以利用更多原始信息,同时兼顾并挖掘数据集间的差异性和关联性,是解决上述问题的有效方法。由此,本文基于广义线性模型和邻域选择方法,提出了条件独立图模型的整合分析方法。本文提出的方法遵循整合分析的基本思想,对于每个节点,同时训练多个模型,并且使得模型之间共享参数。在高维的情况下,模型的估计则采用加入Group Lasso形式惩罚项的拟似然估计方法,Group Lasso的使用能够帮助我们更好地利用整合模型进行邻域选择。而模型的计算则借助近端梯度算法。同时本文介绍了如何借助两部分模型的思想,将该方法推广至对“零膨胀”型数据构建具有较强泛用性的条件独立图模型。本文针对提出的方法进行了多角度的模拟分析。模拟结果表明,以AUC作为评价指标,当不同的数据集间具有相互联系时,整合的条件独立图模型的表现优于通过单一数据集构建条件独立图的方法,并且具有更强的稳定性;同时,与现有的局限性较强的对“零膨胀”型数据构建条件独立图模型的方法相比,本文所提出的方法在不同数据类型的场合下的表现都要等于或优于该方法,具有较强的泛用性。最后,本文将该方法应用于利用Medicare数据构建人类疾病网络,该人类疾病网络的构建基于医疗诊断数据住院时长和再入院次数,能够从新的角度加深我们对疾病间关联性的理解,同时促进提升公共卫生管理的质量和效率。
其他文献
债券市场分析中,利率期限结构是一个不可或缺的工具。本文所研究的省份城投债利率期限结构,相比于市场上常用的按评级归类的到期收益率曲线作为不同省份的城投债定价参考更加科学和精确,能够展示不同省份在投资于城市建设时的融资成本和信用风险变化,具有重要的现实意义。本文通过Nelson-Siegel(NS)模型对2017年10月-2020年03月代表性省份的AAA级城投债交易数据进行实证分析,研究结果表明,伴
在过去的乡村集体和国家所有的土地分开管理的政策框架下,个人对宅基地的营建活动和政府对城镇建设用地的管理活动占据优势地位,出现了乡村宅基地无序扩张和城市近地大拆大建并存的现象,前者导致了生态环境的失衡,后者又损害了乡村居民的利益。当前的土地制度改革的重点,主要集中在乡村宅基地的存量盘活和集体经营性建设用地引入市场两个方面,在新的制度设计之下,政府、集体和个人的作用力重新组合,并强化引入了市场作用力。
随着我国经济体量不断增大、经济结构逐步优化,人们的生活质量稳步提升,人们越来越关注其自身精神层面的需求。同时,随着信息通讯技术的高速发展,互联网近年来在我国发展迅猛。于此时代背景之下,探究互联网与居民幸福感之间的关系具有较强的现实意义。因此,本文主要研究互联网使用对居民主观幸福感的影响及其影响机制。本文首先对互联网与幸福感的文献进行回顾与梳理,基于此,本文提出三种可能存在的互联网使用影响居民主观幸
分子影像技术从初露苗头到蓬勃发展,经历了分辨率由低到高、灵敏度由低到高、成像模式由单一到多样的发展历程,多种成像模式目前已经投入临床使用,并且在疾病的诊疗和监测等方面发挥着越来越重要的作用。随着技术设备日新月异的变革和人们对于诊断准确性和实时性越来越高的要求,单一的成像方式暴露出无法避免的局限性,这一契机也催生了多模式成像技术和设备的发展和多模式成像分子探针的开发,提高了临床诊断的可视性,推动了多
在城市健康街道及步行友好型街道建设的人本视角下,街道空间的优化设计逐渐成为城市规划研究的热点。绿视率作为街道可步行性的评价要素之一,可以对步行者的心理产生影响,同时,步行愉悦度可以用于描述步行者的心理。研究通过对武汉市生活型、商业型、交通型三类街道共9个样本进行比较分析,分析街道步行空间绿视率与步行愉悦度的特征,以及二者之间的关联。结果表明,街道步行空间的平均绿视率与步行愉悦度呈显著正相关,当绿视
在软件项目管理中,质量管理是其中非常重要的知识领域,产品质量的好坏对整个项目的成败有着重大影响。对于公安科技信息化建设来说,软件项目建设周期长,项目干系人较多,软件复杂度高,软件项目的质量管理成为一个难题,软件产品的质量直接关系到公安科技信息化建设的成效。如果软件产品质量不稳定,对于项目的实施工作会带来很大风险。因此必须高度重视软件项目的质量管理,在软件项目实施过程中,综合考虑项目的管理过程和改进
本文主要分析了中国宏观经济因素对股票市场波动的影响情况。首先从理论上分析了不同宏观经济变量对股票市场可能造成的影响及其传导机制,发现通货膨胀指标对股票价格同时存在刺激和抑制的两个作用,汇率的变动可能会从正反两个方面影响股票价格。所以仅从理论上分析宏观经济变量对股票市场的影响并不能完整地表述其关系。因此从实证的角度用计量方法进行分析。传统VAR模型在参数估计时使用的是OLS估计量,在面对小样本时可能
随着对可持续供应链中供应风险的越发重视,评价和选择合适的供应商显得尤为重要。然而,现有研究大多没有从可持续性的三个角度(经济、社会与环境)出发考虑供应风险。同时,现有研究中很少考虑决策者权重信息,也很少将决策者权重信息结合到求解标准权重的环节中。因此,论文针对不确定决策环境下的可持续供应商选择问题,构建了考虑风险的可持续供应商选择决策模型。首先,论文基于直觉模糊集理论,通过语言变量评估决策者的重要
尽管在改革开放以来我国经济实现了高速发展,但是其发展模式并非是可持续的、健康发展的。商业银行在我国资本市场上占据主导地位,以金融手段促进生态文明建设、推动经济可持续发展必然需要商业银行的参与,绿色信贷便是商业银行引导资源合理配置、积极履行环境社会责任的手段。绿色信贷能够加快经济绿色转型,不仅有利于环境保护,更是对银行本身的可持续发展具有重大意义。本文从企业社会责任理论、环境风险理论、成本收益模型、
本文将基于国内试点碳市场运行的经验证据,利用多期双重差分(DID)模型探讨碳排放权交易政策对于试点碳市场中纳入控排名单企业盈利能力的影响。本文的主要结论如下:(1)总样本回归结果显示,碳排放权交易政策显著降低了控排企业的盈利能力。通过倾向得分匹配(PSM)方法处理后,这种负面影响提高了近70%,仍然支持原结论,且PSM方法改进了回归中对处理效应的低估问题。进一步研究表明,控排企业的营业成本和收入均