模式分类中特征选择问题的研究

被引量 : 0次 | 上传用户:hhttllzzwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择在数据分析和预处理步骤中发挥着重要的作用,通过特征选择可以删除无关、冗余的信息,降低训练样本的维数、降低算法的复杂度和噪音的干扰,提高模型的推广能力,因而在分类问题中起着很重要的作用。一个特征选择的过程在原理上可以看成是一个组合优化过程:在原有的特征中选择其中的一部分,使某个给定的评价函数最优。特征选择框架指出一个特征选择算法是由“特征子集生成”、“特征子集评价”、“停止条件”和“结果验证”四个部分组成的。首先,本文基于这个框架,总结归纳了常用特征选择算法的搜索策略和评价准则。然后,本文研究了常用的几种搜索算法:B&B算法、连续选择算法、增l减r法、浮动搜索算法。本文给出了这几种搜索算法在同一数据集上基于类内类间距离这一评价准则下的实验结果,并进行了比较,验证了理论分析。其次,本文详细分析了评价准则中的互信息对于特征选择的意义,以及从样本出发来计算互信息量的方法。采用窗函数估计的非参数密度估计方法,实现了一种基于互信息量的特征选择算法,并在人工数据集和实际数据集上进行了实验验证,对结果进行了分析。同时,把互信息准则与其它的距离准则作了一下比较。最后,本文研究了特征选择中特征的相关性和冗余性,以特征与类别以及特征与特征之间的关联性为标准,提出了一种基于相关分析的特征选择方法,该方法直接从原始特征集中抽取相关性小且分类能力强的特征子集,大大降低了特征空间的维数,减小了运算量。
其他文献
<正>随着临床输血事业的迅速发展,各种血液制品越来越多地应用于临床,各种配血试验应用于血库作业中进行血型鉴定,交叉配血,但完全抗体与不完全抗体,其灵度低,特异性差,为保
基于1996—2011年间中国与日本、德国和沙特阿拉伯等主要禽肉进口国(地区)的面板数据,运用引力模型修正贸易零值的方法分析了SPS措施对中国禽肉产品出口的影响程度。研究表明
三叉神经痛是临床常见的神经系统疾病,其特征是面部三叉神经分布区反复发作的阵发性剧痛,目前西药治疗药物卡马西平副作用较大,手术治疗虽可缓解患者病痛,但风险大,有复发可
目的:探讨方氏头皮针结合体针治疗椎动脉型颈椎病的临床效果。方法:选取2010年10月—2012年6月患者124例,随机分为治疗组与对照组,治疗组采用方氏头皮针配合体针疗法治疗,对
介绍了一种超低纹波开关电源的设计方案,该方案已在150V、250V、300V、450V、600V、1800V等系列开关电源系统中得到检验,其纹波分量仅占输出电压的万分之一。文中详细介绍了该
<正>为了对配电网的运行方式进行综合评价,提出了将配电网的运行综合评价指标的求解视为最优化问题,其中电网的安全性指标、可靠性指标等单一性指标作为约束条件,电网的经济
规制跨国企业在华商业行贿将成为中国加强商业反腐、提升外资质量的重要手段。中国需要系统认识在华跨国企业商业贿赂的诱因、类型及后果。为根本性地遏制在华跨国企业商业贿
研制了一种新型的医用点滴自控报警装置,该装置利用光电检测方式工作。通过设定液体的位置可以改变该液位的折射率,改变光线的出射角,从而引起光电二极管接收光强的变化,检测
<正>小黄被祖父抱回家的时候,只有小小的一团,脑袋抵在颈间,眼神弱弱地看着我。我"扑哧"一声就笑了出来。我拨了一下它的胡须,它顿时仰起头瞪着我。我扯着它的胡须不撒手,笑
期刊
突眼(甲状腺相关眼病)是甲状腺疾病的常见特征之一,主要表现为:眼睑退缩,结膜充血水肿,眼眶疼痛,眼球突出,眼球运动障碍,复视,暴露性角膜炎和视神经受累。严重者视力下降,视