Bayes两类线性判别函数判别效果影响因素分析

来源 :重庆医科大学 | 被引量 : 0次 | 上传用户:huacheng520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Bayes线性判别法是判别分析中的经典模型,适用于多元正态分布数据,其判别效果诸多因素的影响。如何针对不同的研究目的与研究内容,结合具体的数据分布情况,选择最佳的函数以获得最低误判率,是本研究关注的重点。以某医院体检健康中青年人体检数据为蓝本,本研究采用MonteCarlo方法,系统的模拟出两种先验概率的确定方式(等概率与构成比)、6个水平的总体阳性比(0.04,0.1,0.2,0.3,0.4,0.5)、5个训练样本容量水平(50,100,200,500,1000)以及变量间不同相关程度(独立、中度相关、高度相关与全模型),各种组合设定条件下线性Bayes判别函数的刀切法误判率。并对判别效果进行单因素组间比较、析因设计方差分析和线性回归分析。模拟比较结果显示,先验概率的选取和总体阳性比水平对误判率有较大影响作用,以构成比作为先验概率误判率显著低于等概率法且误判率随着总体阳性比的升高而增大;训练样本容量与模型中变量相关程度对判别效果影响不明显。在进行Monte Carlo模拟并得出结论的基础上,应用该医院体检数据,进行真实数据的实例验证,实例验证分为两部分。首先完全延续Monte Carlo模拟的路线,对真实数据进行抽样,选择相应的变量比较四种模型不同样本量、先验概率确定方法设定条件下,模型误判率的情况。第二部分选取三个有实际意义的待判疾病,纳入与疾病有一定关联的人体指标作为自变量建立函数。每种模型的自变量个数为4。样本量水平同样固定为50、100、200、500、1000五个档次,每种设定均采用等概率与构成比两种方法来确定先验概率。实例验证结果为:第一部分结果与预期完全一致,在样本量为200,使用构成比建立全模型时最低;第二部分与预期基本一致,首先以构成比为先验概率的误判率符合前文总结的走势规律,而以等概率为先验概率的误判率与预期出现了偏差,其次样本量对结果的影响基本与预期保持一致,模型一、二均在200左右的水平达到较好的判别效果,模型三则略有扩大,但200以后误判率的降低很少。
其他文献
针对车身开发设计中CADCAE、子系统间相互独立,导致车身设计效率低的问题,开发了汽车车身设计信息集成系统,该CAD/CAE系统由可视化查询模块、结构化查询模块和数据库模块组成,该系统易于实现对先进设计和管理技术的支持,实现对分布式异构与CADCAE应用系统支持下的产品进行虚拟设计,达到对内可支持并行工程的虚拟设计,对外可支持异地合作设计的目的
分析了动态联盟支撑系统中加盟企业的信息需求和相互关系以及两种不同结构类型的支撑系统在获取加盟企业信息和支持动态联盟运行上的方式和特点.从技术和管理两个方面提出了
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
脉冲振荡肺功能(IOS)检查是肺部呼吸力学检查的一类重要指标,基于强迫振荡原理,是诊断和评估气道阻塞性疾病的重要手段。主要指标共分4项,分别是响应频率(Fres)、5Hz振荡频率
目的:为研究辐射后肠道微生态的变化,本实验选用昆明种小鼠,应用60Co r 射线制备小鼠辐射损伤模型,并对辐射小鼠肠道腔菌群与膜菌群进行定量分析。结果:辐射损伤状态下肠道专
(一)目的1.研究和建立多病种综合监测机制和模式。2.描述浙江省主要蜱传病病原宿主动物和媒介蜱地区分布3.描述浙江省宿主动物和主要媒介主要蜱传病病原感染状况(二)内容与方
The estimation of the influence of external conditions on marker enzymes phenotypic classes ratios in agamospermous sugar beet progenies has been carried out. I
The armadillo repeat super-family proteins (ARM repeat super-family proteins) possess tandem armadillo repeats and have been postulated to play different roles
<正>江苏省常州市武进区湖塘实验中学主持的江苏省教育科学"十二五"规划课题"基于尝试教学思想建设自主学习型课堂的研究"和江苏省教育厅组织的"基于测试分析的跟进式改革"重
提出了一种基于VSM的自适应的Web信息过滤系统的设计及实现方法.与传统的信息过滤系统相比,Web上的信息过滤系统具有许多全新的特征.页面为半结构化的文档、页面上的噪声信息