基于K近邻的过抽样算法在不平衡的医学资料中的应用

来源 :中国卫生统计 | 被引量 : 0次 | 上传用户:Eryuelan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的介绍一种基于K近邻的过抽样算法在不平衡的医学数据集分类中的应用。方法首先利用K近邻法删除在分类中容易与少数类混淆的多数类样本;再对新生成的训练集利用SMOTE算法进行少数类样本的扩充,以有效提高少数类的分类性能。结果利用社区人群的慢性阻塞性肺疾病资料验证,基于K近邻的过抽样算法的分类性能比合成少数类过抽样算法及欠抽样方法要强。结论当医学资料出现不平衡特征时,传统分类器的分类效果不佳,基于K近邻的过抽样算法能够获得良好的分类性能,在医学模式识别领域中有较好的应用前景。
其他文献
目的探索治疗下颌角肥大伴颏畸形时隆颏的新方法。方法对15例下颌角肥大患者,在磨削去骨同期,应用所磨削的骨屑植入颏部.颏成形塑形后石膏托固定改善下颌整体形态。结果15例术后
目的 探讨急性心肌梗死(AMI)患者接受早期冠状动脉介入(PCI)治疗后血浆脑钠素(BNP)水平与肌酸磷酸激酶MB(CK-MB)峰值变化的关系,进而通过BNP来定量评价梗死相关动脉是否及时再通.方法
目的探讨冠脉内支架置入后局部内膜增生的情况和血管紧张素Ⅱ1型受体的演变.方法建立冠状动脉支架置入的微型猪动物模型.分别于支架置入后3、7、28、90和180d截取支架段血管
目的制备包含人分泌型内皮抑素基因的重组腺病毒,为下一步探讨其在血管生成依赖性疾病的治疗研究中的应用提供基础。方法以T—Endostatin质粒为模板,通过PCR扩增回收hEndostati
目的探讨急性脑梗死患者发病时间的季节性特点。方法收集某院神经内科病房2007年3月至2010年2月收治脑血栓患者的发病时间资料,运用圆形分布法分析其发病时间的聚集性。结果
目的 通过人卵巢黄素化颗粒细胞体外培养,观察雌、孕激素对其瘦素受体蛋白表达的调控作用。方法 行体外受精-胚胎移植患者经阴道超声引导下取卵时留取卵泡液,分离颗粒细胞体外
目的 探讨三脑室区肿瘤的显微手术方法.方法 156例病人分别采用胼胝体-侧脑室-脉络裂入路、胼胝体一侧脑室一室间孔入路、终板-翼点联合入路等6种不同的术式,均在显微镜下操
目的 探讨直视穿刺法在泌尿外科后腹腔镜手术中的应用优势。方法 应用后腹腔镜行泌尿外科手术213例,包括肾囊肿去顶78例、肾上腺肿物切除65例、肾切除61例、肾输尿管全长切除6
目的了解转化生长因子-β超家族(TGF-βs)在调节卵泡发育过程中的信号转导模式,以探讨在不同发育阶段大鼠卵巢中Smad4蛋白及mRNA的表达.方法选择不同发育时期大鼠卵巢,运用免
目的 筛选子宫内膜不典型增生与子宫内膜癌临床鉴别诊断的有效指标。方法 子宫内膜不典型增生组30例,子宫内膜癌组20例,应用免疫组化方法,检测HCG-α、HCG-β和COX-2蛋白的表达