基于概率的两层最近邻自适应度量分类算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:alex709
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对有限样本下,KNN算法距离量的选择以及以前距离量学习研究中没有充分考虑样本分布的情况,提出了一种新的基于概率的两层最近邻自适应度量算法(PTLNN)。该算法分为两层,在低层使用欧氏距离来确定一个未标记的样本局部子空间;在高层,用AdaBoost在子空间进行信息提取。以最小化平均绝对误差为原则,定义一个基于概率的自适应距离度量进行最近邻分类。该算法结合KNN与AdaBoost算法的优势,在有限样本下充分考虑样本分布能降低分类错误率,并且在噪声数据下有很好的稳定性,能降低AdaBoost过度拟合现象发生。
其他文献
研究捕食系统中捕食者存在疾病的SEIR模型,假设疾病具有潜伏期,所有捕食者新生种群都进行预防接种,运用极限理论,Lyapunov函数和二次复合矩阵等方法,得到了捕食者灭绝和疾病
针对当前汉字输入法普遍存在的不足,提出了一种新音形编码汉字输入法,即利用汉字的首拼音、韵母及组成汉字的基本笔画和少数高频部件来对汉字编码,是对以前笔画和音形编码汉字输
所谓通讯结构的高新艺术,是相对于我国传统的通讯结构艺术而言的。我给这个概念下一个定义:它是指在主题思想的指引下,根据读者阅读兴趣的变化和求异性审美意识的需要,在对传
当前治理汽车尾气污染的最好方法是采用含有贵金属的三元催化剂同时对NOx、HC、CO进行处理。催化转化器的结构性能直接影响催化效率的高低,准确测定及鉴定催化剂中主要部件的
针对认知无线电(cognitive ratio,CR)中的频谱感知问题,提出一种基于可信数据或门融合的合作压缩频谱感知(reliable-OR rule data fusion cooperative compressed spectrum s
建立了一种利用强疏水性分离柱,通过KOH梯度淋洗,同时测定茶叶中F-、Cl-、NO3-、PO43-、SO42-、BrO3-、Br-、NO2-的方法。采用沸水冲泡茶样,茶水比为1:50,时间为5 min,过滤后
《重庆日报》1月15日十一版副刊作品《该说几句重话》,是该报开展《'重庆文学为何在全国大奖中缺席'话题讨论》中的一篇好文章。这篇文章的话,句句实,句句真,句句重,
新闻媒介作为信息产业,该以什么样的面孔,什么样的姿态进入新世纪,是我们每一个报人需要认真思考的头等大事。这篇文章将重点探讨综合报与专业报、中央报与地方报、厚报与广
针对超声基准装置量传范围较窄且现存超声功率基准装置电测系统中高频电压表不易于溯源等问题,利用压电材料能够将电能转变为机械能的效应原理,根据铌酸锂材料的结构特性,对超声
(一) 报纸是一种精神产品,又是一种特殊商品。对于商品,古西腊哲学家、科学家亚里士多德有一个简单的阐述:'每种货物都有两种用途……一种是物本身所固有的,另一种则不然