基于原型方法的特征选择算法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lzj509649444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是模式识别技术的关键技术环节之一。特征选择按照和后续分类算法的结合方式可分为嵌入式、过滤式和封装式。本文主要研究了单变量的过滤式特征选择算法。本文首先引用了M.Dash和H.Liu提出的特征选择框架,这个框架指出一个特征选择算法是由“特征子集生成”、“特征子集评价”、“停止条件”和“结果验证”四个部分组成的。基于这个框架,本文总结归纳了常用特征选择算法的搜索策略和评价准则,并介绍了一些常用的特征选择算法,同时分析了选择合适的特征选择算法所需要考虑的因素。由于模式识别、机器学习等问题的复杂性比较高,数据分布通常呈现多模态分布。基于这个假设,本文提出了一个基于原型方法的特征排序模型。该模型选择同原型内样本距离小的特征。并结合半监督学习问题的具体情况,提出了适用于半监督特征选择问题的Intra-Prototype Inter-Class Sepearability Ration (IPICSR)模型及其特征选择算法IPICSR_FS。试验结果表明基于原型方法的IPICSR_FS算法选择的特征有较强的鉴别能力,算法的鲁棒性好。试验取得较好的结果。针对全监督特征选择问题的具体情况,在基于原型方法的思想指导下,本文详细分析了IPICSR模型,并提出了用于解决全监督特征选择问题的Intra-Prototype Class Margin Sepearability Ration (IPCMSR)模型及其特征选择算法。试验结果显示IPCMSR_FS选择特征的能力明显比其它四个特征选择算法要好。
其他文献
AO幅面彩色扫描仪使用多CCD进行图像采集并通过图像拼接来完成对大幅面原稿的扫描。其大幅面、高精度及高速度等技术指标的要求,对扫描驱动及机械安装调试带来了新的挑战。本
本文首先深入研究了目前查询扩展中所采用的技术,并在此基础上提出基于语义的概念查询扩展模型。该模型采用通过概念语义空间来描述概念之间相关性的方法实现概念扩展,充分考虑
随着现代医学的发展,医疗成像设备在临床诊断和治疗方面得到广泛的应用。由于成像机理不同和人体组织结构的高度复杂性,来自单一成像源的医学图像不能提供医生所需要的足够信
自然景物中桥梁和机场这两类大型地物目标的自动检测和识别无论在军事领域还是民用领域都有重要的应用价值,越来越成为专家学者研究的重点,但直到目前为止,还没有一种通用性
近年来,基于稀疏表示的异常事件检测成为计算机视觉领域的一个研究热点,该方法通常要使用正常样本离线训练一个字典,然后对待检测的样本进行稀疏表示。其主要问题在于:一方面
随着Internet的不断发展,路由查找速度已经成为制约核心路由器性能的主要瓶颈。减少访问存储器的次数是提高路由查找速度的有效途径之一。由于片外存储器价格较片内存储器低
随着信息技术的迅速发展,特别是近年来互联网的普及,网页数量呈指数级增长。为了有效地组织和管理这些海量信息,如何根据网页中的文本信息自动分类已成为目前研究的重要课题
随着彩色信息在相关领域得到越来越广泛的应用,扫描仪和数码相机作为主要的图像输入设备,人们对它们的色彩再现质量也提出了更高的要求。本文主要研究扫描仪和数码相机的色彩
模型驱动体系架构(MDA)是由对象管理组织(OMG)提出的一种新的软件体系架构,它以模型为核心,模型转换为关键技术,通过模型间的转换来驱动整个软件开发。其中,模型转换是MDA开
无线传感器网络(WSN)是继因特网之后,对人们生产生活产生重大影响的IT热点技术,而网络层的路由技术负责在源节点和目的节点之间传输数据,对无线传感器网络至关重要。分簇路由