利用自然最近邻的不平衡数据过采样方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:einstein_2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有过采样方法存在的易引入噪声点、合成样本重叠的问题,提出一种基于自然最近邻的不平衡数据过采样方法。确定少数类样本的自然最近邻,每个样本的近邻个数由算法自适应计算生成,反映了样本分布的疏密程度。基于自然近邻关系对少数类样本聚类,由位于同一类簇中密集区域的核心点和稀疏区域的非核心点生成新样本。在二维合成数据集和UCI数据集上的对比实验验证了该方法的可行性和有效性,提高了不平衡数据的分类精度。
其他文献
无基础快装塔由于其产品特点,快速适应了移动通信技术的发展要求,符合环保节约型的发展理念,对目前已有无线网络疑难站点的解决起到了不可或缺的作用。通过对塔身和机房一体化技
通过将3G移动通信技术应用于智能交通指挥控制系统,并利用发展迅速的3G移动通信网组成3G无线局域网来传输各交通路口信号点的视频和控制信息,为智能交通指挥系统组网提供了一条
【摘要】 本文对比了常用的Word报表生成技术的特点,介绍了基于WordXML技术实现Word报表的优势和流程,并以一个实际应用中的范例给予了说明。  【关键词】 Word报表 WordXML 自动生成  自动化办公系统中,报表组件是必不可少的组成部分。报表组件的种类繁多,使用的技术也不尽相同。常用的商业化报表组件功能强大,支持多种输出格式,但与Word格式完美兼容的不多。在一些习惯使用Word作
在满足产品设计周期的条件下,以完成所有设计任务的时间最短为规划目标,提出并构建了一种面向多设计任务的规划模型。在该规划模型中,设计节点的并发性和任务设计的并行性被考虑
面向产品的回收设计是绿色设计中十分重要的研究领域。本文构建了网络环境下面向产品回收设计的体系结构,研究了面向回收设计的回收材料选择,并确立了产品的回收分类方法。结合
随着计算机技术、网络技术的发展,在计算机上处理的重要信息越来越多。包括企业生产数据、图纸、工艺路线等涉密内容。在信息处理能力提高的同时,系统的连结能力也在不断的提
计算机应用技术的不断发展,利用计算机技术来进行财务管理成为了必然的趋势;通过计算机应用进行财务管理可以提高财务工作效率,改善传统财务管理方法的弊端;本文主要分析了现
介绍了数控仿真软件VERICUT的主要功能,分析了基于VERICUT建立数控加工仿真的工作流程;通过对其刀具轨迹优化原理进行了探索性研究,建立最优化数学模型。最后通过一个“电话
【摘要】随着网络的进一步发展,各种新的网络应用的出现,使得网络规模扩大,一些相应的指标的增加,使一些用户对网络速度及不满程度有所增强。局域网作为网络的一个基本单元,其性能的好坏直接影响Internet的应用。目前由于国家对这方面的相关规定还不是很健全,其质量好坏、性能指标参差不齐。其不光影响用户的利益而且直接影响网络的安全。局域网的性能指标很多本文主要针对带宽、流量来进行研究,并对其进行相关测试得
【摘要】IPv6是下一代Internet的核心协议,现行的IPv4终将被IPv6所取代。国内很多高校都已经开始建设IPv6网络应用。本文分析了IPv4向IPv6过渡的必然和必要性,并结合高校校园网络IPv6的现状以及演变过程,提出了IPv6校园网部署的几种方式。  【关键词】IPv6Pv4校园网  一、向IPv6过渡的必然性  当下广泛应用的IPv4协议存在着很多固有的缺点,IPv6是下一代Int