Smote算法相关论文
矿山岩溶地表塌陷成因复杂,形式多样,为准确预测矿山岩溶塌陷,结合岩溶发育机理,提出基于LOF和SMOTE算法的BP神经网络预测模型。模型首......
2021年以来,在“房住不炒”的总基调下,“三条红线”、限购、限贷等楼市调控政策持续发力,房价快速上涨的势头得以有效遏制。当前......
近几年来,我国汽车产业快速发展,但由于汽车产销规模不稳定、原材料及产品价格波动较大且融资渠道单一等因素,导致汽车行业中存在......
由于移动网络应用与电子支付业务量不断增长,信用卡欺诈的情况也呈现快速增长的趋势,由此给金融机构和运营商带来了巨大的挑战.欺......
针对深度学习入侵检测中出现的数据类不平衡及特征学习不全面等问题,提出了一种基于卷积神经网络(CNN)与双向门控循环单元(BiGRU)......
近年来,随着互联网行业与信息技术的飞速发展,海量数据的时代已经到来,海量数据给人工智能带来迅猛发展,发展飞速的计算机技术为人......
随着信息技术和互联网技术的高速发展,各种各样的数据信息急剧增加、不平衡数据问题广泛存在,使得不平衡数据分类问题成为数据挖掘......
通过审计意见预测模型的研究,可以帮助利益相关者根据上市公司、事务所、审计环境等相关数据推定注册会计师应当出具的审计意见类......
非平衡问题普遍存在于各个应用领域,比如医学诊断、文本分类、故障监测等。传统的分类方法未考虑到数据的不平衡性,会导致非平衡数......
针对风电机组运行数据中故障数据占比小,不平衡数据集影响故障诊断精度与诊断结果的问题,提出一种基于加权模糊核C均值(Weighted K......
现有事故预警模型多依赖大量数据训练,而许多中小企业的安全生产数据积累不足.为了利用少量样本数据训练出相对精确的事故集成预警......
船舶结构可靠性计算包括可靠性分析和可靠性优化设计两个方面,传统的船舶结构优化只考虑设计变量的确定性因素,而船舶结构可靠性优......
铁路信号设备在运营维护过程中积累了大量以文本方式记录的维护数据,为了实现高效准确分类,提出将Word2vec、SMOTE算法与卷积神经......
随着经济全球化的发展,我国海关进出口商品总量逐年增加,对进出口商品征税成为海关的一项繁重的任务。我国海关目前对商品税号的审......
目的 构建基于少数类样本合成过抽样技术(synthetic minority over-sampling technique,SMOTE)算法的化学治疗(化疗)肿瘤患者下呼......
目的 分析真实世界中使用注射用灯盏花素出现肾功能异常的影响因素,为其临床应用提供依据.方法 搜集全国34家医院2002年1月1日至20......
针对癌症数据集中存在非平衡数据及噪声样本的问题,提出一种基于RENN和SMOTE算法的癌症患者生存预测算法RENN-SMOTE-SVM.基于最近......
针对架空输电线路弧垂在计算过程中易受测量数据(温度、风速、档距等参数)影响的问题,提出了基于数据预处理的PSO-BP神经网络弧垂......
期刊
针对非平衡网络景点评论的文本情感倾向性分类问题,本文在数据层面上采用了SMOTE算法,使样本数据的分布达到平衡,并分别结合SVM算......
目的 利用C4.5决策树模型结合SMOTE算法来研究阻塞性睡眠呼吸暂停综合征患者在 CPAP压力滴定过程中转变为复杂性睡眠呼吸暂停综合......
目的 利用C4.5决策树模型结合SMOTE算法来研究阻塞性睡眠呼吸暂停综合征(obstructive sleep apnea syndrome,OSAS)患者在持续正压......
采用支持向量机(SVM)、随机森林(RF)和逻辑回归(LR)等机器学习方法对脑卒中患者进行分类研究,构建脑卒中疾病预测模型,以期为疾病......
目的 探索我国农村地区40岁以上人群的近视性黄斑病变患病率,并基于人工少数类过采样法(Synthetic Minority Over-Sampling Techni......
环境管理重在预防,未雨绸缪从源头治污,提前预测可能引起环境污染风险和产生违法行为的高危污染源,对更加有针对性地进行污染治理......
随着信息技术的迅猛发展,出现了越来越多的数据形态,而流数据就是其中之一。该类数据不同于传统数据,其拥有海量性、实时性和动态......
不平衡数据集指的是数据集内各类样本点数目相差较大的数据集。使用传统的数据挖掘算法处理不平衡数据集存在着准确率低下、分类效......
随着互联网的发展,人们越来越多地依靠网络来获取和发布信息,互联网中存储和传播的信息对于大众舆论的形成和传播有巨大的影响,其中也......
针对类别不平衡的数据分类效果差的问题,本文提出了一种基于簇内样本平均分类错误率的混合采样算法(SA-BER),该算法首先对少数类使......
随着信息技术的飞速发展,各式各样的信息数据给人们带来不同的有用信息,其中不平衡数据集内所蕴含的有用信息逐渐被人们挖掘和使用......
现如今我们的生活与网络息息相关,网络在给人们的生活带来巨大便捷的同时也存在着安全隐患。人们为了消除这些隐患,便提出了网络入......
本文针对在数据分布不平衡环境下,分类模型难以对样本类别进行高效、精准预测的问题,进行了一系列的研究。首先,对经典的不平衡数......
该文通过对来自19个不同行业的4163家上市公司进行分析,基于BP-神经网络算法确定了不同行业上市公司的财务数据造假相关指标,并以......
在实际生活中总会遇到大量的不平衡数据问题,但是这类数据集的分类效果往往不太理想。如何能够提高不平衡数据集的分类效果是学者......
信用卡业务作为一种非现金业务,属于银行的核心内容以及主要的收入来源,因此其市场竞争相当激烈。而这种激烈的竞争所带来的业务量......
[目的]基于网络舆情事件展开分析,确定其属性特征及分类.当出现新的网络舆情事件时,可提前预测该事件是否会发生反转,既能帮助政府......
随着我国信贷业务的逐年增加,金融机构和地方经济得以蓬勃发展,但也伴随着信用风险的不断增长。为了有效规避风险,减少客户误判导......
不平衡数据是指数据集中属于某一类别的样本量远超过其它类别的样本量,即所属不同类别的样本量间存在较大差异。研究人员常把在数......
随着计算机水平的迅猛发展,银行也在信息化水平上得到了突飞猛进的进步,在这其中伴随着业务的不断跟进,智能化水平的不断提高,产生......
分类问题是一个十分重要的课题,传统的分类算法大多基于类别平衡的情况。但是,在实际问题中,存在着大量类别不平衡的数据,这给分类......
随着现代技术发展的越来越快,人们的生活变得更加舒适便捷,交通工具己经成为了人们的生活出行的必需品。现如今由于汽车数量的增加......
随着电信市场的发展,市场竞争越来越激烈,运营商发展新客户成本较高,客户流失分析已逐渐成为电信公司业务分析的重要环节。如何构......
在经济全球化的背景下,我国信用卡市场发展迅速,银行可以从信用卡业务上获得较大的经济收益,但同时面临着信用卡客户违约的风险。......
作为国际海事界公认的节能减排技术措施之一的轻量化技术,有助于降低造船成本、提升船舶在航行中的各种操纵性能,有效提升船舶综合......
由于移动网络应用与电子支付业务量不断增长,信用卡欺诈的情况也呈现快速增长的趋势,由此给金融机构和运营商带来了巨大的挑战.欺......
目的:脑卒中是一种突然起病的脑血液循环障碍性疾病,居全世界主要死因的第二位,分为缺血性脑卒中和出血性脑卒中,两者的治疗方法大不相......