不平衡学习相关论文
图像因其表现形式丰富和反映事物直观等优势,已成为大量信息的重要表现形式和人们获取信息的重要来源。随着信息时代的到来,人们更......
类别不平衡数据分类问题是机器学习领域中的常见问题。为了缓解类别不平衡问题带来的负面影响,一种常用的方法是对不平衡数据集中......
2019年的资本市场又是令投资者胆战心惊的一年。康美药业近300亿货币资金不翼而飞,康得新连续4年间累计虚增利润总额119.21亿元。......
孪生网络是一种建立在度量学习理论基础上的机器学习方法,与其他神经网络相比,能较好地解决小样本等分类问题,成了机器学习领域的......
不平衡分类是一个重要的研究领域。在不平衡数据集中,至少有一类(少数类)的样本数量是远远少于其它类别的样本数量。如果在不平衡数......
Android恶意应用检测是保障用户信息安全的重要方法。为提高Android恶意应用检测的准确性,从特征选择、不平衡学习、对抗攻击三个......
学位
类增量学习技术在近年来逐渐成为机器学习领域的研究热点,其技术特点是在增量学习过程中随着数据规模的持续扩大,数据类别也随之增......
在信息全球化的今天,数据是蕴含着许多信息的重要载体,如何深度挖掘数据中有价值的内容是研究者们热衷讨论的话题。在当今的大数据......
像传统机器学习一样,样本的不平衡分布会影响深度学习分类器的预测能力,在语音情感识别环境下,情感数据的不平衡分布是一种常态.基......
遥感信息提取技术在国民生活的各方面发挥着重要作用。然而,绝大多数遥感信息提取应用所面对的都是不平衡数据集。特别地,随着城镇......
类不平衡数据处理是当今机器学习与数据挖掘领域的研究热点与难点之一。在类不平衡数据分类中,类重叠度、噪声样本、变量维度以及......
针对现实场景中大量无监督数据无法有效利用的特点,提出了一种基于数据相似度匹配的半监督学习算法.该方法结合一定的先验知识,通......
不平衡学习问题是机器学习领域的难题之一,其困难主要是由于不平衡数据集本身的特点造成的。比如,某类样本数量严重不足,样本分布......
计算机博弈是人工智能领域里的热点研究课题。传统计算机博弈模型使用极大极小搜索与评估函数相结合的方式,棋力高低依赖于搜索的......
在大数据时代背景下,电子商务、第三方支付等线上业务爆发式增长,随之而来的是日益猖獗的线上欺诈案件,在线欺诈检测技术作为企业......
现实生活中存在着很多不平衡类数据分类问题,同时计算机和互联网技术的快速发展,使得现实生活领域的数据膨胀速度异常迅猛,因而大数据......
类不平衡问题,也被称为不平衡类问题或稀有类问题,是模式识别和机器学习领域研究的热点问题之一。对于两类问题,类不平衡问题的特......
不平衡数据学习是机器学习中一个研究热点,近年来得到广泛的关注.以SMOTE为代表的过采样方法是不平衡数据学习的主流方法之一,近年......
智能电表集成了电能计量、数据采集、远程费控等功能模块,具有操作简便、功能多样的优点,但同时由于其功能日益丰富、结构日益复杂......
关系抽取(Relation Extraction,RE)是信息抽取(Information Extraction,IE)的重要组成成分,一般指的是利用信息抽取技术从序列中抽......
随着机器学习相关技术的进步,各领域都积极地将这些技术应用到其生产经营的过程中。然而,大多数原始数据中的样本分布是不均衡的,......
随着《中国制造2025》战略的提出,传统行业向智能制造转型已经成为一个趋势,工业智能化将是构成未来智能制造体系的关键所在。工业......
随着计算机以及信息技术革命的推进,全球互联网用户在电商以及社交新闻平台频繁的活动产出了海量的不平衡文本数据,人们迫切希望从......
现实世界中,大规模图像数据集通常呈现长尾分布现象,少数类别含有大量的样本,大多数类别仅有极少量样本。传统的视觉识别方法应用......
不平衡学习是机器学习的重要研究内容之一。不平衡数据在类别分布上呈倾斜分布,通常情况下少数类具有更高的价值,但在多数类的影响......
不平衡数据普遍存在于实际生活中。通常,机器学习中的大多数分类算法都是假定数据集具有平衡的分布或相等的误分类代价。这些算法......
随着互联网社交平台的蓬勃发展,传统的社交方式、商业经济结构正发生巨大变革。人们越来越青睐于通过微信、微博等社交工具与他人......
维生素是许多酶反应中的重要辅酶因子,是人体代谢活动中必不可少的有机化合物。酶是具有生物催化功能的生物大分子,主要由蛋白质组......
针对由于网络流量数据不平衡而导致入侵检测模型检测率低的问题,提出了一种基于聚类和实例硬度的入侵检测过采样方法(CHO)。首先,......
机器学习技术与其他产业的加速融合与发展,促进了以物联网、大数据、机器人等产业为代表的自动化和智能化产业集群的形成,成为推动......
在信息时代,伴随着海量数据获取与存储技术的快速发展,如何从数据中获得有价值的信息和规律成为了许多行业的热点问题。作为人工智......
针对加权极速学习机人为固定权重可能会错失更优权重的问题,提出了改进的加权极速学习机。该方法的多数类的初始权重设为1,使用多......
目前的多类学习方法大多将多类问题转化为二类问题,这样处理除了时间开销大,还存在识别盲区。提出了一种直接进行多类学习的算法mult......
在现实问题中,相似性学习的样本对存在不平衡现象,即相似性样本对的数量会远小于不相似性样本对的数量.针对此问题,文中提出两种样本对......
为了有效地解决不平衡问题,提出一种新颖的基于稀疏邻域和主动学习采样机制的不平衡学习策略。该策略可以克服虚拟样本合成的限制,......
计算机博弈是人工智能领域中的热点研究课题.传统计算机博弈模型使用极大极小搜索与评估函数相结合的方式,棋力高低依赖于搜索的深......
目标检测是计算机视觉研究中的一个经典任务,有许多重要应用如自动驾驶,安全监控等。目标检测旨在在图像或视频序列中定位出感兴趣......
针对电力设备中正常类数量多、故障类数量少的特点,传统分类方法不易取得较好效果。笔者提出将不平衡学习应用与故障诊断。根据数......
为克服不平衡数据集中存在的噪声、小分离、类内和类间不平衡问题,提出一种基于HDBSCAN(hierarchical density-based spatial clus......
污水处理过程的故障诊断数据具有高度不平衡性,影响了故障诊断效果,尤其是降低故障类别的识别正确率,导致出水水质不达标、运行费......
为了预防运载火箭总装过程中因动态事件引发的工期延误问题,保证火箭总装任务的按期交付,提出一种工期延误预警方法.该方法包括3个......
传统分类算法一般要求数据集类别分布平衡,然而在实际情况中往往面临的是不平衡的类别分布。目前存在的数据层面和模型层面算法从......
生物信息学是一门涉及生命科学和计算科学的交叉学科,致力于通过计算和统计技术来解决生物数据分析和计算中所产生的实际问题。生......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......