模式分类中数据选择方法的研究

来源 :西华大学 | 被引量 : 10次 | 上传用户:cairinga
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在模式识别中,数据选择越来越重要,对识别的效果起着很关键的作用,尤其是边界数据、冗余数据、杂质数据对分类效果的影响,它大大降低了样本识别率,成为实际问题中亟待解决的难题。本文针对边界数据、冗余数据、杂质数据三种数据,对两种已有的方法进行了拓展,并给出了一种新的数据选择的方法,主要研究成果可归纳如下:1.K近邻法通常是按照样本之间的距离来选择K个近邻,本文用特征分量来选择K个近邻,该方法的优点是按照分量来找K个近邻,而不是用整体样本来找K个近邻,避免了样本中某一分量的负面影响。2.在剪辑近邻法中通常涉及到两个集合:测试集和参考集,本文通过相互变换两个集合对剪辑近邻法进行了拓展,改进了原来的剪辑近邻法,在很大程度上提高了样本识别率。3.为了去除冗余的数据,保留稳定的或者可靠的数据,我们提出了一种新的方法来完成样本选择的过程。其主要思想是用K均值聚类方法先将样本分成C类,然后在比较新旧两类样本集,并取出它们的各自公共元素(样本)作为更新的样本集。此时,更新的样本就是比较稳定的样本。另外为了表示不同样本在每一类中的重要性,我们在更新的样本中给出一种新的模糊关系。文章的最后,作者总结全文,指出了有待于进一步解决的问题,并对数据选择的前景作出了展望。
其他文献
期刊
与环境不可避免的交互作用引起的量子比特的消相干是实现量子计算的一个主要障碍。量子纠错码提供了最有效的方法来克服消相干。Shor构造了第一个量子纠错码[[9,1,3]]。自此,
矩阵特征值问题是数值代数领域的重要分支之一,在许多工程计算和现代科学中都有广泛的应用。因此,研究矩阵特征值的求解方法具有重要的理论意义及应用价值。  Krylov子空间方
上世纪七十年代,物理学家为了解释一些物理现象,希望能在分形集上定义”Laplace”算子.迄今为止,数学家已发展了在有限分歧的自相似集上构造能量形式(即相应的Laplace)的两种方
期刊