类不平衡相关论文
针对分类任务中的不平衡数据集造成的分类性能低下的问题,提出了类不平衡数据的EM聚类过采样算法,通过过采样提高少数类样本数量,从根......
针对现阶段深度睡眠分期模型存在的梯度消失、对时序信息学习能力较弱等问题,提出一种基于双向长短时记忆卷积网络与注意力机制的......
当前,随着互联网的高速发展,万物互联的理念创造了更多的软件应用场景,而更多的应用场景也带来了更多的软件故障。如何在研发软件......
恶意加密流量识别公开数据集中存在的类不平衡问题,严重影响着恶意流量预测的性能。本文提出使用深度生成对抗网络DGAN中的生成器和......
城市地标是在结构、认知或视觉上比周围其他对象显著的空间对象,作为反映城市空间布局特征的重要元素,城市地标在空间认知和寻路导......
滚动轴承是旋转机械的重要组成部件之一,及时准确地故障诊断在现代工业系统的可靠性和安全性中起着重要作用.然而现有故障诊断方法......
随着互联网技术的蓬勃发展,人们的生活越来越便利,但与此同时,网络安全问题也随之而来,严重影响着网络的应用及各类用户的安全,因......
道路提取作为遥感影像对象提取环节中的重要角色,可以为道路提供语义信息和位置信息,属于一种特殊的语义分割任务,目标是将图像像......
为了解决国内家庭经济困难学生的就学问题,政府非常重视对助学金的发放工作,通过国家政策、学校组织和学生监管贯彻落实对贫困生的......
随着“数据化”时代的到来,数据挖掘成为了研究的热点.研究者们从不同的角度出发,提出了很多有效的数据挖掘方法,取得卓越的研究成......
针对于类不平衡的偏标记学习问题,提出一种可以较有效处理类不平衡问题的偏标记K近邻学习算法(K-nearest neighbor algorithm for c......
为解决类不平衡和样本重叠问题,提出一种基于分层欠采样和Bi-GRU的恶意行为检测模型(SSU-BG).数据预处理及特征模型的构建;基于欧......
自闭症谱系障碍(Autism spectrum disorder,ASD)是一种常见的脑部疾病,近年来,随着计算机技术和医学影像分析技术的发展,使用静息态......
入侵检测数据维数大、数据样本不均衡、数据集分散性大的问题严重影响分类性能,为了解决该问题,文章提出基于极限随机树的特征递归......
当前流量分类方法在面对类不平衡流量时,往往存在着在少数类上的分类效果不佳的问题.针对该问题,提出了一种面向类不平衡加密流量......
随着数据采集技术的不断发展,实际应用中收集到的数据逐渐呈现规模大、维度高和不平衡的特点。高维不平衡数据学习在许多重要应用......
为了缓解软件缺陷预测的类不平衡问题,避免过拟合影响缺陷预测模型的准确率,本文提出一种面向软件缺陷预测的基于异类距离排名的过......
软件缺陷预测是软件工程领域中的一个研究热点.跨项目缺陷预测(Cross-Project Defect Prediction,CPDP)采用源项目的缺陷数据来预......
针对半监督软件缺陷预测中的类不平衡以及特征中含有过多无关特征和冗余特征的问题,提出一种改进的半监督集成软件缺陷预测方法FeS......
为了解决传统分类算法在不平衡样本集上分类效果不佳的问题,提出一种新的欠采样boosting集成算法(FECBoost).首先,通过改进的模糊......
期刊
随着文化建模的发展,背景知识开始用于预测恐怖组织在特定背景下的恐怖行为。组织的背景知识会影响组织采取的恐怖行为,因此利用组......
客户流失是许多商业部门都极其反感的问题。每个行业都渴望建立和保持一个忠实的客户群。在无线通信行业中,有许多因素会导致客户......
针对网络评论中普遍存在的负面评论较少而影响力却较大的类不平衡问题,提出一种基于类不平衡学习的情感分析方法.该方法利用深度学......
随着互联网用户群体急剧增长,网络规模迅速膨胀,网络业务类型也变得愈加复杂。为了提供安全、可靠的网络环境,对网络进行高效管理......
科学技术的发展促进了大数据时代的产生,使得数据已经日渐成为推动当今所有行业和业务职能领域发展的重要资源.如何从指数式增长的......
软件缺陷预测能够在项目开发中预测出可能存在缺陷的软件模块并对其进行重点测试。当前,软件缺陷预测根据预测目标主要包括分类预......
随着互联网的飞速发展,信息的表示形式越来越多样化。作为一种直观明了且易于理解的信息表达形式,图像已成为大数据的重要组成部分......
随着信息技术的快速发展,软件产品已经渗透到社会生活的各个领域,软件开发的规模和复杂度也随之增加。然而,软件中的缺陷是不可避......
类不平衡是数据挖掘领域的十大难题之一,在学术界和产业界备受瞩目。所谓类不平衡是指样本数据中某一类的样本远多于其它类样本,从......
microRNAs(miRNAs)是具有保守性的短核苷酸序列,在基因转录调节中扮演着重要的角色。将microRNA序列特征进行量化,采用机器学习技......
软件缺陷预测技术是依靠机器学习算法来挖掘和分析软件历史数据,从而发现软件产品中存在的高风险模块,将有限的测试资源分配到高风......
深度学习由于强大的特征提取能力,在克服类不平衡问题上具有一定优势,但分割精度和效率仍需提升.针对此问题,文中提出基于三重交互......
针对SMOTE(synthetic minority over-sampling technique)等基于近邻值的传统过采样算法在处理类不平衡数据时近邻参数不能根据少......
交通流不同状态在实际中出现的频率存在很大差异,且不同交通状态之间的误判所造成的影响程度是不同的。因此,可以认为交通状态判别......
大部分数据流算法都是基于类分布大致平衡这一假设的,然而在现实世界中数据流中类的分布往往是不平衡的.同时,数据流中目标概念可......
近年来,类不平衡问题已逐渐成为人工智能﹑机器学习和数据挖掘等领域的研究热点,目前已有大量实用有效的方法.然而,近期的研究结果却......
极限学习机广泛用于分类、聚类、回归等任务中,但在处理类不平衡分类问题时,前人未充分考虑样本先验分布信息对分类性能的影响。针......
针对背景知识数据集中存在的类不平衡对分类器的影响,根据背景知识数据集样本量小、数据维数高的特性分析了目前各种方法在解决背......
针对网络流量分类过程中出现的类不平衡问题,该文提出一种基于加权对称不确定性(WSU)和近似马尔科夫毯(AMB)的特征选择算法。首先,......
在实际电子侦察过程中,由于各种原因,侦收到的不同类型信号数量相差很大,类别之间严重不平衡,常规方法在这种数据集下训练得到的分......
特定类的思想是将传统的多类特征提取和识别任务转化为多个两类问题,由此产生了类不平衡问题,影响最优鉴别特征的提取。为了解决该......
现实生活中数据的分布往往是非线性且不平衡的,传统的线性鉴别方法已经很难提取有效的鉴别信息,于是文中将算法扩展到核空间,提出......
软件缺陷预测是提升软件质量的重要手段。为了改善缺陷预测性能,目前许多机器学习领域的最新成果已经引入到软件缺陷预测中。但是,......
提出一种多核字典学习方法,用以对软件模块是否存在缺陷进行预测。用于软件缺陷预测的历史数据具有结构复杂、类不平衡的特点,用多......
传统的局部保持降维方法追求最低的识别错误率,即假设每一类的错分代价都是相同的.这个假设在真实的人脸识别应用中往往是不成立的......
软件缺陷预测有助于提高软件开发质量,保证测试资源有效分配。针对软件缺陷预测研究中类标签数据难以获取和类不平衡分布问题,提出基......
摘 要: K-means型算法在处理类不平衡数据时趋向于形成大小相同的簇,是“均匀效应”。针对这一问题诸多研究者提出了不同的聚类算法,......
针对P2P类不平衡问题提出将复杂的多类不平衡问题转化为简单的两类不平衡问题,再通过迭代SMOTE过抽样技术丰富P2P的概念表达,从而......