【摘 要】
:
为解决不平衡数据内在固有性引发的分类结果受强势类影响较大的问题,研究基于KL距离的不平衡数据渐进学习算法,精准地辨识出不平衡数据中的弱势类样本,提高算法分类性能.在深入分析KL距离和欠抽样法的基础上,使用欠抽样法平衡化处理不平衡数据集,采用基于KL距离的不平衡数据半监督学习算法,以渐进模式,通过寻找可靠正例、可靠反例,实现处理后数据集的最终分类.实验结果表明,上述算法的G-mean值始终较高,可极大地提高算法分类性能;所提算法使用后的F-measure值在任何抽样比例下都高于使用前的F-measure值,
【机 构】
:
山西大同大学计算机与网络工程学院,山西 大同037009
论文部分内容阅读
为解决不平衡数据内在固有性引发的分类结果受强势类影响较大的问题,研究基于KL距离的不平衡数据渐进学习算法,精准地辨识出不平衡数据中的弱势类样本,提高算法分类性能.在深入分析KL距离和欠抽样法的基础上,使用欠抽样法平衡化处理不平衡数据集,采用基于KL距离的不平衡数据半监督学习算法,以渐进模式,通过寻找可靠正例、可靠反例,实现处理后数据集的最终分类.实验结果表明,上述算法的G-mean值始终较高,可极大地提高算法分类性能;所提算法使用后的F-measure值在任何抽样比例下都高于使用前的F-measure值,且在抽样比例较大时,F-measure值呈缓慢上升趋势,能很好地分类出不平衡数据集中的弱势类样本.
其他文献
常用天气雷达回波外推方法建立的天气雷达回波外推模型,设置编码器和预测器长度和步长偏小,导致模型外推预测天气精度低,于是提出基于卷积神经网络的天气雷达回波外推模型.转换雷达图像数据集坐标,计算天气变化粒子的经纬度值,修正天气变化粒子距离地面高度,预处理天气雷达图像数据;将卷积神经网络分为正向传播和反向传播两种,分别训练卷积神经网络数据传播过程;采用卷积层和采样层交替布置的方式,设置编码器和预测器长度和步长,建立天气雷达回波外推模型预测天气.实验结果表明:对比三组天气雷达回波外推模型,所设计模型具有较高的外推
针对布谷鸟算法求解复杂的问题时收敛速度过低、全局效果不理想等问题,提出基于反向学习的布谷鸟算法优化搜索方法.对当前布谷鸟群体加入反向学习策略,从全局中找出精英个体,并对个体求反向解,在所得的可行解与反向解中找出最优个体作为下一次迭代的个体.将混沌扰动策略引入鸟巢位置的确定过程,扩大布谷鸟种群的多样性,提高算法整体的收敛精度和搜索能力.最后进行仿真,运用不同方法对四个函数测试的结果中可以看出,所提方法具有更优的搜索能力和收敛速度.
针对当前多变量时间序列分类方法未考虑降维处理多变量时间序列,导致多变量时间序列分类精度较低,分类时间较长的问题,提出了基于深度置信网络的多变量时间序列分类方法.通过构建深度置信网络模型结构,基于受限玻尔兹曼机,提取可见单元与隐藏单元特征信息,采用Isomap算法,在深度置信网络内进行优先特征提取操作,通过附加约束构造半正定矩阵,降维处理多变量时间序列.在低维特征空间内,利用支持向量机中分线性分类函数,计算得到拉格朗日乘子,根据正则化参数特性,通过高斯核函数,计算得到最优核函数,完成多变量时间序列分类.实验
多标签分类算法已广泛应用于文本分类、图像识别、基因功能分类等领域,为了解决多标签分类算法较少考量标签之间的相关性等问题,提出一种基于标签相关性的多标签分类算法.首先对BP神经网络进行改进以适应多标签分类算法,然后对标签集分别使用皮尔逊相关系数和关联规则进行二阶、高阶相关性分析,最后将标签的相关性与改进的BP神经网络算法得到的概率做线性插值,得到样本属于某标签的最终概率.通过在4个真实数据集上利用5个多标签分类指标做对比实验,验证了提出的算法分类效果明显优于现有的多标签分类算法.
针对鱼眼图像校正中在纵向方向校正效果不佳,中心关键区域不突出以及鱼眼有效区域提取效率低的问题,通过遍历横竖两个方向的中垂线以获得有效区域图像.在畸变点周围建立校正量场,在校正量场中建立畸变点与校正点之间的几何关系,遍历每个畸变点,并根据校正关系获得校正量,获得校正图像后,为获得光滑图像,结合hermite插值算法对校正图像进行插值运算.首先实验表明,新的提取算法效率大幅提高,并获得较准确有效区域,提取有效区域后校正算法对视图主要区域的校正和纵向方向的畸变取得较好效果.上述提取算法和校正算法提高校正速度,提
肺癌辅助诊断技术根本上是为了帮助医生进行诊断分析并提供一定的依据[1].在边缘检测时运用了改进的Canny算法,在分割后进一步分割出肺结节.传统Canny算法采用的高斯滤波和高低双阈值不具有自适应性.使用者需要人为设定参数.采用自适应中值滤波代替高斯滤波,并用迭代法阈值选择算法得到双阈值,从而对Canny算法进行改进,并在肺部CT上进行试验,通过肺结节大小、位置、形状等生理特征判断是否患有肺癌.结果证明,上述方法可以更准确提取出肺结节轮廓并初步分析患者是否患有肺癌.
在综合管廊建设及使用的过程中,有很多的难题待解决,比如地裂缝的存在会使上下盘的土体存在垂直沉降差异,从而使管廊受力不均匀;另外,地震使得管廊及其内部的管道会受到损坏而影响其使用寿命。本文对跨地裂缝综合管廊的地震响应规律进行了研究,为地裂缝地区综合管廊的抗震研究提供了可靠的依据,进一步推动了此方面的研究发展进程。本文主要通过振动台实验以及模拟计算来进行研究,其中,通过实验研究了当地裂缝与综合管廊的交
鼠年春节前后,新型冠状病毒肺炎(下称新冠肺炎)疫情席卷全国,让原本欢天喜地迎接春节的人们猝不及防,正常生活受到严重影响,心理受到重大挑战,对此,个体的社会支持系统显得极为重要。目的:为考察新冠肺炎疫情期间普通民众社会支持的来源、种类、影响和阻碍个体获得社会支持的因素,为实践中如何有效地在疫情期间帮助普通民众度过难关提供一定参考和启发。方法:运用质性研究方法,按照目的性抽样原则招募访谈对象,采用面对
针对异构网络数据的缓冲存储效率低、分区存储精准度、运行代价高等问题,提出异构网络数据缓冲区替换算法的数学模型.首先将异构网络数据划分为多个数据阶层,确定数据格式,同时利用新的异构网络数据传输途径控制传输链路,对控制算法的窗口大小进行计算,以此梳理数据.最后将缓冲区分为冷区与热区两部分,分析算法的干扰因素,利用交替算法完成异构网络数据缓冲区替换算法的数学建模.仿真结果表明,基于异构网络数据缓冲区替换算法的数学模型可以有效提升算法的效率和精准度,同时可以降低算法运行代价.
针对相关滤波类目标跟踪算法在目标出现遮挡、目标快速移动、复杂背景等情况下跟踪精度低的问题,提出了一种上下文感知自适应的相关滤波跟踪算法.首先,提取目标周围8个方向的背景样本为相关滤波器提供训练样本,然后利用粒子滤波对目标的运动状态进行估计,预测目标的运动方向.在训练滤波器时,给予目标运动方向上的背景样本更多的权重;接着,引入了一种新的模型更新判别依据APCE,只有当APCE值和响应最大值同时分别以一定比例大于各自的历史平均值时,才对模型进行更新;最后将上述算法与当前一些主流的跟踪算法在基准测试集OTB10