不均衡数据相关论文
随着信息化发展,PDF文档以其良好的特性,成为日常流行的数据交换文件格式,也成为APT攻击事件中常被利用的文件载体。现有的恶意PDF文......
滚动轴承作为机械设备核心的零件,其性能影响着整个生产设备的稳定运行,研究滚动轴承智能故障检测技术意义非凡。传统的故障检测技......
随着越来越多用户习惯线上消费,电子商务平台积淀了海量的用户行为数据,提供了用户购买预测的数据条件。为更加精准高效地从海量商......
癫痫综合征是癫痫疾病的精准类型,包含了多种复杂的发作症状。癫痫综合征的精准分类和分析,使医生能够及时地采取积极的预防措施,......
为了解决正负样本不均衡分布造成的分类边界偏移,训练模型对少数类样本学习不充分的问题,提出了融合条件熵和TFIDF的HTTE过采样方......
随着信息技术的快速发展,各行各业所创造的数据总量以惊人的速度快速增长。为了能从海量的数据中获得有效的信息,数据挖掘技术应运......
纵火是一种特殊的犯罪形式,具有犯罪动机复杂,调查取证难的特点。纵火除了造成人员伤亡和财产损失外,还可能会产生巨大的社会影响,......
在实际的数据分类任务中,经常面临数据类别分布不均衡的问题,具体表现为属于某一类的样本数远超过另一类。若直接使用分类器对不均......
在模式识别中,由于对象或条件限制,样本集中往往某些类别样本数量远大于其他类别。使用不均衡数据训练的分类器趋向于把样本识别为多......
本文为了满足海量数据处理需求,提高生产制造企业的数据分析和处理能力,设计了一款功能完善、适用性强大的大数据分析平台。首先,......
数字化经络仪、中医健康量表和四诊仪是中医临床常用辅助诊断工具,数据分布不均衡、同一个病例具有多个诊断标记是临床数据常见现......
在各个领域中不均衡数据问题都广泛的存在,如医疗领域、故障诊断领域以及欺诈检测领域等。因此对不均衡数据进行研究且找到有效的分......
随着计算机网络技术的飞速发展,网络中各种电子形式的文本以指数级的速度增长,然而不同主题类别之间文档数量往往会出现指数级的差异......
目的 通过对不均衡数据集的急性阑尾炎患者住院费用预测,探索提高少数类高费用患者住院费用预测精度的方法,为患者治疗方案选择、D......
在许多场景和应用领域中,不均衡数据学习是一个常见并且长期存在的问题。例如在实际生活中电信管理,信用卡欺诈检测,诊断数据中的......
随着我国互联网技术的飞速发展,导致碎片化信息增多,让舆情监测工作面临了新的挑战.越来越多的研究者开始通过情感分析的方式对碎......
在现实网络环境中,数据分布不均衡是普遍现象,也是研究的热点问题。利用传统机器学习算法解决该问题的研究成果较多,综述性研究也......
针对风机数据集的不平衡问题,提出了一种BSMOTE-Sequence采样算法,在合成新样本时综合考虑空间和时间特征,并对新样本进行清洗,从......
在数据挖掘研究领域,分类任务广泛存在着数据分布不均衡问题,例如制造状态检测,医疗诊断,金融服务,等等.SMOTE是处理不均衡数据分......
针对基于不均衡网络评论的服务质量评价研究中存在的评论语料分布不均衡和特征词提取依赖主观经验的问题,在利用不平衡网络评论构......
针对高斯混合模型能有效表征任意空间分布信息的优势,提出一种基于变分贝叶斯高斯混合模型的不均衡数据集的自适应采样处理,以获得......
SMOTE算法被广泛应用在不均衡数据研究中,但原始数据集中的噪声数据可能会使数据边界模糊造成数据分布改变.本文基于采样平衡与特......
期刊
现实应用中所面对的数据往往在不同的类别上的分布极不均衡,不同类别被错误分类而造成的代价损失也不同,因此使用传统的分类算法来......
不均衡数据分类下对其特征进行高精度识别,能够有效提高数据的均衡分类精度,改善数据混乱现象。对数据分类过程下的特征识别,需要......
软件缺陷预测在提高软件质量、控制和平衡软件成本方面起着举足轻重的作用,是软件工程的活跃领域.研究者提出了许多预测技术,从不......
目的针对不均训练集导致印刷套准识别模型无法较好识别印刷套不准图像的问题,提出基于最大相关、最小冗余的印刷标志图像数据特征......
物质的太赫兹光谱具有唯一性。目前,结合先进的机器学习方法,研究基于规模光谱数据库的太赫兹光谱识别技术已成为太赫兹应用技术领......
基于分形自相似性理论改进SMOTE算法,实现数据集的均衡化。结合集成学习Adaboost技术更新样本权值,改善非均衡数据的分类性能,并对......
股票研报是由金融行业分析师对股票相关新闻作出的分析和评价,它从专业角度分析此类新闻是否会对某股票的未来走势产生影响,并提出......
为了解决传统分类器的过拟合现象,从而增强分类性能,提出了一种基于核空间中K-近邻算法的混合取样的不均衡数据集分类算法。该算法......
代价敏感学习是解决不均衡数据分类问题的一个重要策略,数据特征的非线性也给分类带来一定困难,针对此问题,结合代价敏感学习思想......
针对现有机器学习算法难以有效提高不均衡在线贯序数据中少类样本分类精度的问题,提出了一种基于主曲线的不均衡在线贯序极限学习......
为了提高传统支持向量域描述(C-SVDD)算法处理不均衡数据集的分类能力,提出一种基于密度敏感最大软间隔支持向量域描述(DSMSM-SVDD......
在对样本分布不均衡的数据进行预测分类时,样本均衡化往往是最重要的一步,而不同的均衡化方法产生的结果不同。对于“少数类”样本......
化探异常识别是成矿预测的重要依据。化探异常识别本质上是一不均衡数据的分类问题。异常识别过程中面临的主要问题是高维数据的处......
使用医疗信息系统的数据进行睡眠呼吸暂停低通气综合征(OSAHS)预测和分析过程中,存在不平衡数据问题。为此,在现有临床研究的基础上,......
针对传统的分类算法以及精度作为评价指标不能够满足现实分类问题的需要,将代价敏感方法引入支持向量机中,提出一种新的学习算法CS......
目的针对不均衡的印刷标志图像训练集构建的二分类模型,对少类的印刷套不准图像识别准确率低的问题,研究不均衡印刷标志图像套准状......
传统的支持向量机(SVM)算法在数据不均衡的情况下,分类效果很不理想。为了提高SVM算法在不均衡数据集下的分类性能,提出随机下采样......
针对现有学习算法难以有效提高不均衡在线贯序数据中少类样本分类精度的问题,提出一种基于不均衡样本重构的加权在线贯序极限学习......
在分布均匀的海量数据情况下,现有的入侵检测模型均具备良好的检测性能。但网络中产生的海量入侵数据的分布通常具有不均衡特点,而......
目的针对不均衡的印刷图像套准状态检测中存在的印刷套不准图像识别准确率低的问题,研究不均衡印刷图像训练集的预处理方法。方法......
不均衡数据分类下对其特征进行高精度识别,能够有效提高数据的均衡分类精度,改善数据混乱现象。对数据分类过程下的特征识别,需要先获......
近年来,人工智能(Artificial intelligence,AI)在诸多领域已经取得了巨大成功,如人脸识别、智慧医疗、自然语言处理和语音识别等。......
为减少不均衡数据对支持向量机分类性能的影响,提出一种基于二次支持向量机的欠取样分类算法,该算法依据样本的分类超平面贡献大小对......
新时期下,电信企业的战略目标已经由新客户开发转向老客户保留。在越发成熟的电信市场,新客户的开发难度越来越大,需要消耗大量的......