基于局部概率抽样的标签噪声过滤方法

来源 :计算机应用 | 被引量 : 4次 | 上传用户:wori10000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类学习任务中,在获取数据的过程中会不可避免地产生噪声,特别是标签噪声的存在不仅使得学习模型更复杂,而且容易造成过拟合并导致分类器泛化能力的下降。标签噪声过滤算法虽然在一定程度上可以解决上述问题,但是仍然存在噪声识别能力较差、分类效果不够理想以及过滤效率低等问题。针对这些问题,提出一种基于标签置信度分布的局部概率抽样方法来进行标签噪声过滤。首先利用随机森林分类器对样本的标签进行投票,从而获取每个样本的标签置信度;然后根据标签置信度的大小,将样本划分为易识别样本和难识别样本;最后分别采用不同的过滤策略
其他文献
阐述了施工项目管理的内容和特点,项目管理的施工系统,项目成本控制原则,项目成本控制措施,并且分析了项目管理与成本控制之间相辅相成的内在关系,并提出了加强项目管理和成
针对目前推荐系统存在的数据稀疏和冷启动等问题,提出了一种融合重叠社区正则化及隐式反馈的协同过滤方法(OCRIF),该方法不仅考虑了用户在社交网络中的社区结构,而且将用户评分信息与社交信息的隐式反馈融入推荐模型之中。此外,由于网络表示学习可以有效学习节点在社交网络的全局结构上的近邻信息,提出了一种网络表示学习增强的OCRIF(OCRIF+),该方法结合社交网络中用户在网络中的低维表示与用户-商品特征
数字图像处理课程以专题化教学内容和项目为驱动,在创新教学环境下,教师应从知识传授者变成学习的组织者、指导者,而学生能够进行自主学习。通过激发学生学习积极性,从而真正提高大学课堂教学的效率。
近年来,在严峻的宏观经济形势和强手如林的建筑市场竞争中,安装企业如何在扬长补短、趋利避害中,把握新的机遇;在深化改革中,加快科学发展的步伐,江苏天目建设集团有限公司结合企业
@@建筑业是国民经济的支柱产业,也是反映固定资产投资变化的指标行业。2009年,在国家大额、超常规投资的推动下,建筑业有效克服了金融危机的影响,总体上保持着积极向上发展的态势
针对目前我国许多科技期刊其论文的图题表题有相应的英文翻译,分析了其价值所在:参与国际学术交流的科技期刊,其论文图题表题英译有一定的意义;主要在国内传播与交流的科技期
随着科技的发展,计算机技术已经渗透到社会生活中的各个领域,给人们带来了极大的便利,但随之而来的也有各种各样的问题,其中备受关注和亟待解决的当属安全问题。本文将首先介
当前中国社会频发"群体恐慌"事件,折射出人的科学全面发展潜在的社会问题主要有:部分民众社会责任感缺失、思想道德水平不高、法制意识淡薄;社会焦虑、浮躁的不良社会心态;民众