【摘 要】
:
在机器学习与数据挖掘领域,数据集时常存在类别不平衡问题,这往往会对分类算法产生一定的负面影响。对不平衡样本进行扩充,在数据层面恢复数据集的平衡性,是解决此问题的一种较为通用且有效的方法。对于低维数据,已经有多种经典算法可以进行有效的数据扩充。对于高维图像数据,一般可采用图像变换方法增加样本数量。这种方法在一定程度上可以减轻类别不平衡问题给分类器带来的负面影响,但效果非常有限。作为一种强大的生成模型
论文部分内容阅读
在机器学习与数据挖掘领域,数据集时常存在类别不平衡问题,这往往会对分类算法产生一定的负面影响。对不平衡样本进行扩充,在数据层面恢复数据集的平衡性,是解决此问题的一种较为通用且有效的方法。对于低维数据,已经有多种经典算法可以进行有效的数据扩充。对于高维图像数据,一般可采用图像变换方法增加样本数量。这种方法在一定程度上可以减轻类别不平衡问题给分类器带来的负面影响,但效果非常有限。作为一种强大的生成模型,生成对抗网络能够学习到数据的真实分布,生成符合原始样本分布的高质量人工样本。利用这个性质,本文使用改进的生成对抗网络模型来增强图像数据,以提高深度学习分类器在不平衡图像数据集上的分类效果。本文的主要贡献包括:(1)提出了判别信息优化条件胶囊生成对抗网络。首先,该方法使用胶囊网络对生成对抗网络的判别器进行改进,并成功将条件约束信息加入到胶囊判别器中,提高了判别器的判别能力。此外,针对生成对抗网络在不平衡数据集上生成数据偏向负类样本的问题,通过优化判别器的输出,使其对数据类别信息更加敏感,提高了生成器生成正类样本的能力。(2)提出了生成器信息增强生成对抗网络。首先,该方法利用预训练变分自编码器对生成对抗网络的生成器进行初始化,使得生成器在对抗训练之前就能获得所有类别数据的全局信息,从而增强对抗训练的稳定性。此外,生成对抗网络判别部分引入独立的分类器,在训练过程中为生成器提供额外的分类信息,有效缓解了在不平衡数据集上生成数据偏向负类样本的问题。实验结果表明,在多种类别不平衡图像数据集上,本文方法能够生成符合类别条件的高质量多样性图像样本。相较于其他算法,在经本文方法增强后的数据集上,深度学习分类器性能得到了显著提高。
其他文献
复糟酱香型白酒生产废水不同于常规的酿酒废水,其存在大量木质素分解产物、单宁酸、腐殖酸等难降解复杂污染物,经传统的“厌氧+好氧”生化处理后,COD和色度无法达标,必须进行深度处理。微气泡臭氧非均相催化氧化技术因其高效的传质和良好的催化活性在废水深度处理领域受到广泛关注和研究。本研究采用微气泡臭氧非均相催化氧化工艺对复糟酱香型白酒生产废水生化出水进行深度处理试验。制备筛选性能良好的负载型催化剂,探究催
我国中小河流量多面广,作为水生态系统的“毛细血管”,发挥着向“大动脉——大江大河”贡献水量和营养物质的重要作用。相对于大江大河,串联更多城市的中小河流受到的人类活动干扰更为严重,为人民群众提供美好生活环境的作用也更为突出。不同于以往水污染治理的以水环境质量改善为核心,河流生态修复更加关注生态系统的功能恢复。河流功能定位与自身生态特征及周边人类活动状况息息相关,不同功能河段的生态修复重点也应有所区分
锂离子电池(LIBs)作为一种成熟的储能技术,已广泛应用于便携式电子设备,并逐渐应用于新能源汽车。然而LIBs的发展受到了资源短缺和成本上升等问题的限制,促使研究人员研究和开发可替代的能源存储设备。钾离子电池(KIBs)的储能机制与LIBs相似,且金属钾具有储量丰富、容易获取等优势,这些优势使得KIBs有望成为LIBs的替代品。然而,K+半径较大,导致KIBs的容量保持率较低,速率性能较差。开发能
电解水析氢的传统高活性催化剂为Pt等贵金属材料,但是其造价昂贵且地球含量稀少,目前发展低成本、高效、地球储量丰富的非贵金属催化剂至关重要。MoSe2是一种重要的过渡金属硫属化合物,因其较低的氢吸附能垒和高的电化学活性等受到人们的关注。然而,由于MoSe2纳米片易于团聚和堆叠,加之其导电性较差,阻碍了MoSe2在电催化中的应用。将MoSe2与其他材料复合构建异质结构,并结合导电性基底构建自支撑电极为
为了地表水环境质量的持续转好,我国污染物排放总量控制不断加强,更加严格的城镇污水排放标准地方标准陆续出台,城镇污水处理厂排放标准提高已成为大趋势。受限于高效、低成本的反硝化脱氮技术还不够成熟,污水厂为降低TN出水浓度,势必要加大碳源投加量,往往花费巨大。为了获取成本更低的反硝化碳源,本研究在团队前期玉米芯固体碳源反硝化脱氮研究基础上,采用物理-化学、生物-化学等手段将玉米芯中碳源提取到液体中,获得
紫外光电探测器是指将入射的紫外辐射信号转换成电信号的装置,在军事和民用领域中有着非常重要的应用,例如火焰探测、空间通信、生物医学分析、海洋油污监测、导弹的预警与跟踪等。近年来,有机-无机卤化铅钙钛矿材料凭借其优异的光电性能和简单的制备工艺,在光探测领域受到了广泛的关注。然而,因其有限的可调带隙范围(410-700 nm)、铅的毒性以及有机铵盐的不稳定性这三大问题的存在,限制了其在紫外光电探测器应用
高强度低合金钢广泛应用于工程机械、矿山机械、汽车制造等领域。国内生产的高强钢在弯曲成型过程中会出现开裂、起皱等问题,而国外的高强钢力学性能及弯曲性能比较优越。因此本文对国内NM450钢的连铸、铸坯再加热、热轧过程微观组织及力学性能进行研究,同时对弯曲成型后的NM450钢的断裂原因进行分析。本文采用准静态拉伸实验、磨损实验、OM、SEM、EBSD、TEM等表征手段对高强度低合金钢的性能及微观组织、拉
作为一种储能器件,超级电容器有着充电迅速、充电功率密度大、循环寿命长、对环境友好和体积小等优势。超级电容器比传统的可充电电池更适合作为便携设备的电源,因此受到了广泛的关注。黑磷作为一种层状半导体材料,被广泛用作超级电容器的电极材料,但是黑磷超级电容器的储能能力有限。为了提高黑磷超级电容器的储能能力,黑磷基复合材料引起了人们的注意。磷化镍在电化学方面有着优异的表现,但是合成困难,且极易出现团聚现象导
金刚石作为一种极限功能材料,在石油勘探、精密仪器加工、医疗、半导体等相关领域有着极大的应用价值。尤其是在半导体领域,金刚石更是因其具有超宽的禁带(~5.47 e V)、高热导率(120 W/cm·K)和高击穿电场(2×10~7V/cm)等优异性能,被誉为“终极半导体材料”。硼掺杂金刚石的导电性可以从高度绝缘到接近金属,用硼掺杂金刚石或金刚石薄膜制备的p型半导体器件已经实际应用于废水处理、医疗等方面