先验概率对贝叶斯判别法判别效果的影响研究

来源 :2016年中国生物统计学术年会 | 被引量 : 0次 | 上传用户:kcl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  背景与目的:贝叶斯判别法是判别分析中一种常用的重要方法.该方法在考虑各总体先验概率及误判损失的前提下,采用取得的样本修正先验概率分布,进而判别样本的归属.本研究通过计算机模拟实验探讨先验概率对贝叶斯判别法判别效果的影响,刻画先验概率影响贝叶斯判别法判别效果的内在实质.方法:在各变量间相互独立及误判损失相等的假设前提下,运用SAS9.4软件模拟各个类别内服从多元正态分布的二类、三类数据,探索不同类之间先验概率不等的情况下贝叶斯判别法的判别效果.通过计算误判率,评价判别效果,误判率低,则判别效果好,反之则判别效果差.根据模拟数据结果,计算类间先验概率及类间广义平方距离的方差,运用R3.2.2软件对数据作图,呈现类间先验概率差异大小、类间广义平方距离差异大小以及误判率之间的关系.结果:在二类、三类贝叶斯判别法中,结果显示随着类间先验概率差异逐渐增大,类间广义平方距离的差异亦逐渐增大,误判率逐渐下降.在二类贝叶斯判别法中,当类间先验概率的差异增大时,误判率间的差异逐渐增大,且差异具有统计学意义(x2=50.3,P<0.01);在三类贝叶斯判别法中,结果亦是如此(x2=236.1,P<0.01).结论:通过计算机模拟实验,揭示了增大类间先验概率的差异,能使类间广义平方距离的差异增大,最终改善判别效果.
其他文献
会议
在临床试验中使用替代终点可以缩短研究时间,减小样本量,避免依从性下降及数据缺失情况的发生.本文回顾了替代终点的统计学评价方法,并作讨论.对替代终点的统计学评价方法进行归纳总结,并对多种不同的方法进行了比较.
会议
针对单样本、两独立样本和配对样本三种设计,在固定效应模型下,建立改进Youden指数方法的meta分析方法.本研究仅考虑固定效应模型,并考虑以Mantel Haenszel法和极大似然法进行效应量合并.通过Monte Carlo模拟,考察不同模型下,不同加权方法所得合并效应量置信区间的覆盖率,研究其统计学性能.
围绝经期是指女性从开始出现绝经趋势直至最后一次月经后一年的时期,一般始于40岁,历时短则1~2年,长则10~20年,在这期间由于女性体内丘脑-垂体-性腺轴之间平衡制约关系紊乱而引起的一系列躯体、精神及心理症状称为围绝经期综合征.由于每位女性经历绝经的过程、时间、症状等方面不同,难以精确定义、量化围绝经期的起止时间,将围绝经期定义为40~60岁.研究女性围绝经期综合征的相关因素,进而采取相应措施进行
Cox比例风险模型是目前生存分析中最常用的多因素分析方法,然而,Cox模型不能有效处理时依协变量,也无法估计基准风险函数,进而影响绝对风险的估计.但在医学中,不满足PH假设的情况较为常见,同时,绝对风险函数和基准风险函数在对疾病发展史的认识方面有重要意义.针对Cox模型的不足,有研究者提出了灵活参数生存模型,本研究旨在比较灵活参数生存模型中的PHS模型与Cox模型在探索缺血性脑卒中病灶部位与复发关
偏最小二乘判别分析(PLS-DA)是代谢组学中常用的多元分析方法,利用PLS-DA建立多变量模型常涉及差异变量的筛选.通过变量筛选剔除数据中的非信息噪声变量,简化模型复杂程度,提升模型性能.由于高维组学数据变量和观测数不均衡的特点,当变量数远大于观测数时,变量筛选出现偶然相关,可能使无差异的研究对象间产生差异,交叉验证建立及选择PLS-DA模型往往会给出与真实情况不符的显著结果;随变量数与样本数比
会议
目的 建立一种新的基于bootstrap中位数的增量成本效果比(ICER)的估计方法,并与现有方法进行准确性方面的比较.方法 通过Monte Carlo模拟与现有的ICER估计方法进行比较,现有方法包括均数方法、bootstrap模拟方法和中位数方法.模拟时共考虑了成本和效果的分布形态、组间方差齐性、成本和效果的相关性、样本量以及标化增量效果五个因素.准确性评价指标采用相对误差百分比.结果 前三种
目的:探究2012-2014年我国中医院卫生资源配置的公平性,为中医院卫生资源的合理配置提供参考依据.方法:采用基尼系数和泰尔指数对2012-2014年我国中医院主要卫生资源配置的公平性进行分析评价.结果:按人口分布,中医院卫生资源的基尼系数位于0.04-0.4之间;按地理分布,基尼系数位于0.3-0.9之间.中医院卫生资源配置的总体泰尔指数位于0.0025-0.0164之间,其中区域内的泰尔指数