【摘 要】
:
类别不平衡是现实世界普遍存在的问题,其严重影响着各种预测模型的预测效果,使得这些模型仅能准确识别出多类样本,却不易识别出少类样本.本文提出一种基于边界增强和去噪的自适应双权重过采样(Adaptive Double-Weight En-hanced Boundary and Denoising Oversampling,ADWEBDO)方法,以处理不平衡问题.ADWEBDO的主要思想是:引人K近邻(K Nearest Neighbor,KNN)去噪技术,降低噪声样本合成的可能性;提出一种基于类间距离和少类簇
【机 构】
:
上海理工大学光电信息与计算机工程学院,上海200093
论文部分内容阅读
类别不平衡是现实世界普遍存在的问题,其严重影响着各种预测模型的预测效果,使得这些模型仅能准确识别出多类样本,却不易识别出少类样本.本文提出一种基于边界增强和去噪的自适应双权重过采样(Adaptive Double-Weight En-hanced Boundary and Denoising Oversampling,ADWEBDO)方法,以处理不平衡问题.ADWEBDO的主要思想是:引人K近邻(K Nearest Neighbor,KNN)去噪技术,降低噪声样本合成的可能性;提出一种基于类间距离和少类簇大小的双重权重样本分配方法,有效避免了类重叠现象的产生;采用模糊C均值(Fuzzy C-Means,FCM)聚类算法,对样本进行聚类分析,提高了合成少类样本的可靠性;提出一种基于特征空间的合成样本策略,增加了合成少类样本的多样性和合理性.最终,本文提出的方法在7个UCI数据集上进行实验,并取得了令人满意的结果.
其他文献
附着于输电线路上的各类障碍是电网安全稳定运行的重大威胁,传统的清障方法或存在安全隐患,或耗能较高,且大多需要停电处理,而激光能量高、准直性好,可用于远距离无接触击落异物或融化覆冰.因此,文中综述了激光清障技术在电网中的应用现状与发展,首先总结了激光清除异物、覆冰、树障等不同类型障碍的原理与应用;然后对比了常用于清障的几种激光器的特点;最后分析了激光波长、激光功率、光斑直径等参数对清障效率的影响,研究了激光照射导线、绝缘子时功率密度与照射时间的安全阈值问题.激光清障技术目前已被广泛应用于清除线路悬挂异物,但
光热发电(CSP)在电力系统中发挥的效益与CSP的运行方式、储热时长等密切相关,合理评估CSP效益对CSP的发展具有重要影响.文中提出一种全面评估CSP容量效益、电量效益的等值年费用法,并计及了机组启停、储能电源跨日调节.对含有CSP的系统进行8 760 h生产仿真模拟,比较CSP投运前后系统火电装机需求和煤耗的变化,评估CSP的容量效益和电量效益,进而评估CSP的国民经济性.对西北地区实际电网进行仿真,仿真结果验证了所提方法的有效性.研究结果表明:CSP的国民经济效益与CSP的投资、调峰方式、储热时长和
针对VGG16网络识别驾驶员分心时参数量多、分类准确率低的问题,提出了一种基于多尺度通道的分类模块MCAM.分类模块MCAM包括MCM模块和MSE模块.MCM模块将卷积特征图分离为4个子特征图,使用不同的卷积核对4个子特征图进行空间信息提取,以期提高分类准确率;MSE模块为改进的通道注意力,其使用一维卷积来改进原始通道注意力中的全连接层,降低了全连接层大量参数问题.将MCAM嵌入VGG16中,并使用非对称卷积辅助降低参数量.实验结果表明,使用MCAM模块在State Farm Distracted Dri
文中研究了受端级联型混合高压直流(简称混合直流)输电系统的控制特性,分析了受端柔性直流在下垂控制模式下对级联型混合直流控制特性的影响,明确了混合级联直流的总体伏安特性曲线.相比于主从控制,采用下垂控制的模块化多电平换流器(MMC)具有同时控制直流电压和直流功率的能力,不会出现功率反送现象.但在下垂控制作用下,MMC无法实现直流电压的准确控制.因此,文中提出一种受端级联型混合直流输电系统的自适应下垂控制策略,该策略可根据系统直流电流的变化实时调节下垂特性,避免MMC的直流电压随直流电流的变化而产生波动.最后
自动驾驶是一个复杂的、系统性的研究项目,在实际的测试过程中,为了确保安全,虚拟仿真测试成为自动驾驶测试的关键,在检测驾驶模型是否可以做出正确的判断,减少安全事故的发生等方面有着不可替代的作用.本文在虚拟仿真测试的基础上,提出有关图片扰动的自动驾驶测试的数据生成方法,通过对检测数据的核算来测试模型是否可以做出缺陷判断.数据显示,本文使用到的模型的缺陷检测会受到相应测试环境的影响.
针对大规模风电接入电力系统带来的消纳问题,提出一种考虑需求响应及抽水蓄能的鲁棒机组组合优化方法.一方面,建立计及需求响应和抽水蓄能机组运行特性的数学模型,协同优化提高系统运行的灵活性;另一方面,采用考虑不确定预算的风电功率不确定集合描述风电随机波动特性.综合考虑系统运行约束及鲁棒可行性约束,采用基于仿射补偿机制的再调度策略,以系统运行成本最小为目标构建鲁棒机组组合模型,同时根据对偶原理将构建的鲁棒优化模型转化为确定性的数学规划问题进行优化求解.在改进的IEEE 39节点系统中进行算例仿真,验证了所提方法的
随着多车道的出现,高速道路匝道数目的增加以及道路特点,使车辆行驶环境变得尤为复杂,导致行驶事故极易发生.考虑到行车场景的复杂性,本文分析车辆间关系,推导邻车关联性及碰撞机理,充分考虑邻车状态对本车的影响,建立多车道车辆运行碰撞风险模型,并计算危险度.以前车相对速度和相对距离为输入,建立隶属度函数以及对应规则,定义各参数的论域范围,利用模糊控制方法求解出合理的期望加速度,结合安全距离模型建立纵向避障控制策略,实现纵向避障.
直流故障限流器(FCL)是抑制直流短路故障电流的关键设备,其在交直流混合电网中十分重要.文中提出一种多功能模块化直流FCL拓扑,由多个电力电子功率单元子模块串联组成,通过模式控制与切换,实现故障限流、能耗泄放和直流网压支撑3种功能.文中详细分析了多功能模块化直流FCL的运行机理,给出了其在交直流混合电网中的典型配置方案,并针对3种功能对应的工作模式,完成了控制策略设计与开发.为验证拓扑结构及控制策略的有效性,在Matlab/Simulink中构建多工况仿真模型.仿真结果表明,所提模块化直流FCL拓扑及控制
结核感染T细胞斑点试验(T-SPOT.TB)是一种可靠的结核感染诊断方法,而确定T细胞菌斑数量是T-SPOT.TB中的一项重要工作.针对现有的菌落自动计数系统对T细胞菌斑图像适用性较差的缺点,提出了一种基于改进分水岭算法,对T细胞菌斑图像进行全自动分割和计数的方法.该方法首先利用霍夫变换将培养皿区域提取出来,再使用中值滤波去除图像噪声,然后结合阈值分割、形态学处理和面积滤波等方法识别出图像的粘连区域,最后使用分水岭算法对图像进行分割,并通过对粘连区域的二次分割实现粘连目标计数修正.本文以50多例培养皿样本
当前综合微能源网系统优化运行策略鲜少考虑碳交易政策影响,为此,文中提出一种计及碳排放成本的混合储能综合微能源网系统优化运行模型.该模型首先结合源-荷-储及能源转换装置进行综合微能源网系统配置,根据碳排放配额分配实施方案建立考虑碳配额的优化目标函数.然后以某地区数据为算例基础进行仿真,利用Gurobi求解得到满足碳排放成本最小时的系统优化运行结果.算例结果表明,碳排放免费配额能够降低综合微能源网系统运行成本,影响系统运行策略.文中所提模型能够反映碳排放成本因素对能源消费结构的影响,为综合微能源网系统能源结构