【摘 要】
:
目前流行的分类算法(如决策树、神经网络)都是基于类分布均衡的假设,以高总体准确度为目标.如在肿瘤的诊断中,将99%的个体诊断为健康,便可达到99%的准确度,但这种分类算法并无任何实际意义.医学中患者的数量远远小于健康个体,在医疗诊断中病人误诊为健康与健康个体误诊为病人付出的代价是不同的,因此,准确的识别出病人更加重要.那么,如何增加患者的识别率,同时兼顾健康个体的准确度,是亟待解决的分类问题.本文
论文部分内容阅读
目前流行的分类算法(如决策树、神经网络)都是基于类分布均衡的假设,以高总体准确度为目标.如在肿瘤的诊断中,将99%的个体诊断为健康,便可达到99%的准确度,但这种分类算法并无任何实际意义.医学中患者的数量远远小于健康个体,在医疗诊断中病人误诊为健康与健康个体误诊为病人付出的代价是不同的,因此,准确的识别出病人更加重要.那么,如何增加患者的识别率,同时兼顾健康个体的准确度,是亟待解决的分类问题.本文以代谢综合征为例,从数据处理角度出发,采用重采样技术平衡数据后,用BP神经网络、C4.5决策树分类体检中的代谢综合征患者.
其他文献
利用综合质量得分和蒙特卡洛模拟方法进行医生治疗质量分级研究,获得治疗质量分级最优的医生,为科学评价医生治疗水平、医院管理绩效考核及提高医生的治疗质量提供依据.
将排队模型运用到卫生统计学课程中心建设的优化研究中,对课程中心学生的排队系统的结构进行验证和模拟,揭示学生提问和回复问题的时间分布规律.
比较长庆油田职工和陕西省居民的高血压和糖尿病患病水平,采用Logistic回归模型计算倾向指数评分,选用最邻近匹配法进行1:1匹配.匹配后采用单因素和多因素logistic回归模型比较两个人群的慢性病患病率差异.结果表明该企业的常见慢性病的防控挑战比普通人群更大,应该更加重视男性员工慢性病健康教育与管理。
利用融合排序思想,结合四种变量筛选方法建立排序融合模型,使用该模型所获得的变量融合排序进行紫癜性肾炎差异变量的筛选.结果表明相比于其它变量筛选方法,排序融合模型在筛选变量时更具可靠性和准确性,可为代谢组学数据提供新的分析思路和方法。
根据所得临床病例数据,采用倾向指数匹配法均衡混杂因素带来的影响,从而分析甘油三酯与冠心病的关系。经匹配后,消除混杂因素的影响,甘油三酷含量高低对冠心病有影响。
在中国,HIV依然是影响人群健康的主要威胁之一.抗病毒治疗(Antiretroviral therapy,ART)能有效抑制病毒复制,延缓疾病进展,提高患者生存质量,同时可以降低HIV传播风险.且越早开始治疗,个人和社会获得的受益越多.从2016年起,国家调整ART治疗策略,推荐所有HIV/AIDS患者都开始治疗,但在新治疗策略下患者的治疗意愿尚不明确.因此,此次研究基于社会生态学模型(Socio
介绍区间删失资料下,运用贝叶斯方法对比例风险模型进行参数估计与分析过程,以及R软件实现方法.采用Lin等提出的以单调样条来构造基线累积风险函数,运用Gibbs抽样进行后验分布的计算等来对区间删失数据下的比例风险模型进行贝叶斯统计分析,并基于某医院的冠状动脉疾病研究项目,探索经过治疗的冠心病患者其心血管疾病复发时间的相关危险因素,采用“ICBayes”R语言包来实现这一过程.
较大的头围可能含有更多的神经元或突触连接,为认知功能提供更大的储备率.该研究旨在通过前瞻性队列来验证头围大小是否与中国老年人发生痴呆的风险相关.结果表明老年男性较小的头围和较高的痴呆风险之间的关联。注意儿童时期,特别是男孩脑中容量的中和发展,可能有利于大脑储备,防止晚期认知衰退。
探索不同突发事件与各医学救援装备之间的关联程度,为构建不同类别突发事件中模块化装备体系提供依据.基于文本挖掘中共现分析的研究思想,利用CNKI数据库,统计不同突发事件与装备的共现频数,构建“事件-装备”的热力图谱;经社会网络分析,构建“事件-事件”“装备与装备”和“事件-装备”三类共线网络,并通过R软件进行可视化分析;最后根据以上构建的“事件-装备”关系网,推算各项装备与突发事件的相关度.
“老年糖尿病患者”在我国多指六十岁及以上的新发或已患病的糖尿病患者.据报道,我国60岁以上老年人群糖尿病的患病率波动在9.14%~14.49%,糖尿病己成为威胁老年人身体健康与生命的重要因素.这种慢性疾病不仅难以治愈,并且很难用传统的临床指标评价治疗效果.为此,常利用生命质量等量表测评量表来进行综合的评价.国外已经有针对老年糖尿病患者多维健康测评量表,由于存在文化等差异,国外的量表并不能完全体现出