【摘 要】
:
图像分类作为计算机视觉领域的热门研究方向之一,已成为模式识别、人工智能等相关领域的重要基础。同时,深度学习技术的出现推动了图像领域的发展,随着深度学习在计算机视觉领域的不断突破,深度神经网络以其强大的学习能力提升了图像识别的各项评价指标。然而,在海量的数据中,不同的图像数据集存在各自不同的问题,从而限制了其识别能力。此外,图像分类任务中的非平衡问题在现实应用中也十分常见,已成为机器学习和数据挖掘领
论文部分内容阅读
图像分类作为计算机视觉领域的热门研究方向之一,已成为模式识别、人工智能等相关领域的重要基础。同时,深度学习技术的出现推动了图像领域的发展,随着深度学习在计算机视觉领域的不断突破,深度神经网络以其强大的学习能力提升了图像识别的各项评价指标。然而,在海量的数据中,不同的图像数据集存在各自不同的问题,从而限制了其识别能力。此外,图像分类任务中的非平衡问题在现实应用中也十分常见,已成为机器学习和数据挖掘领域中的突出问题之一。高度非平衡的高维图像数据的分类问题仍旧面临着巨大的挑战,尤其是在某些少数类样本十分有限的情况下,问题难度大大增加。目前基于过采样的方法生成的样本容易局限在有限的真实样本附近,从而导致数据分布上的平衡度远远低于样本数量上的平衡度。因此,研究针对少数类样本稀少的高度非平衡的高维度图像分类问题具有很高的学术意义。其中,权衡生成样本质量和多样性之间的关系是非平衡问题中的重要研究目标之一。已有的方法主要包括样本级别上的操作、基于模型的搜索,或通过加入噪声这种随机性较强的方式增加多样性,而缺少特征层面的研究。因此,基于特征的方法还有待深入探索。本文将深度学习理论与相关生物视觉机制以及进化算法结合,通过分析问题的特点及需求,完成如下研究工作:(1)针对图像分类任务中相似类别的图片易混淆、目标相对于背景图案不突出的问题,受生物视觉系统中视觉感知过程以及视觉记忆机制的启发,提出了一种基于视觉长短时记忆(Visual Long-short-term Memory,VLSTM)的神经网络集成模型。VLSTM模型由视觉感知模块、视觉短时记忆模块和视觉长时记忆模块并行集成。根据不同模块的特性,选择并设计相应的网络模型,从而模拟生物视觉系统分别提取图片的视觉感知信息、视觉短时记忆信息和视觉长时记忆信息。VLSTM集成模型在两个公用数据集上进行了评估,实验结果表明,VLSTM在不同模块上提取的特征一定程度上是互补的,且符合各自模块代表的视觉信息的特性,并获得了优越的分类性能。(2)在高度非平衡且少数类样本数目有限的高维度图像分类问题上,为了挖掘同一个数据集中少数类样本和多数类样本之间的关联性和分布相似性,实现多数类样本到少数类样本的知识迁移,提出了基于条件变分自编码(Conditional Variational Autoencoders,CVAEs)的自迁移(CVAEs based Self-Transferred,CVAE_Se Tred)算法。CVAE_Se Tred算法集分布学习(Distribution Learning)、自迁移学习(Se Tred Learning)、图像生成(Image Generation)以及数据集再平衡(Dataset Rebalancing)于一体,并在两个非平衡数据集上验证有效性。实验证明该模型能够稳定收敛,且可以学到既具有域不变(Domian-invariant)性质又服从多维高斯分布(Multivariate Gaussian Distribution)的关键隐层特征。(3)由于生成的数据分布与真实数据的分布相似程度决定了生成数据的质量和多样性,针对非平衡问题中生成样本的质量和多样性之间的权衡问题,提出基于改良的分布式估计算法的隐层特征分布进化(Modified Esitimation Distribution Algorithm based Latent feat Ure Distribution Evolution,MEDA_LUDE)算法,通过深度神经网络和进化算法联合学习隐层特征空间的最佳分布。在MEDA_LUDE算法中,探索了最大间隔高斯混合(Large-margin Gaussian Mixture,L-GM)损失函数在我们假设的更为复杂的条件下对分布学习的作用。同时为了满足质量-多样性间权衡的需求,设计了基于样本之间相似度的适应度函数,改进了分布式估计算法进化隐层特征分布的方式,从而引导隐层特征分布空间的搜索。MEDA_LUDE可以生成兼顾质量和多样性的样本,并在两个非平衡的公用数据集上得到了有效验证。(4)针对纺织工业背景下织物疵点分类及非平衡问题,提出了具体的应用解决方案。首先,依托东华大学数字化纺织服装技术教育部工程研究中心所提供的硬件采集设备,采集、处理并构建了东华大学织物疵点数据集及其非平衡数据集。此外,基于阿里云公开的织物疵点原始图像构建了阿里云织物疵点数据集及其非平衡数据集。针对纺织背景下织物疵点分类任务中相似类别易混淆、缺陷相较于纹理背景不够突出以及非平衡问题,结合织物疵点图像的结构特性和数据特点,研究了相应的深度网络模型并设计了具体的网络参数。在构建的数据集上的实验结果表明,我们设计的网络模型相比于其他方法能有效完成织物疵点分类任务。
其他文献
微带线是由沉积在基板上的金属导体带和接地板构成的微波传输线。作为柔性电子器件的一部分,织物基微带线在连接电子元件及传输信号等方面扮演着重要的角色。其中,采用刺绣技术形成的织物基微带线既具有一定的柔性,又具有良好的电学性能,故备受关注。由于刺绣工艺参数对微带线电学性能的影响规律尚未揭示,等效基板尚未确定,难以合理设计具有特定特性阻抗(一般为50Ω)以及良好电学性能的微带线,故制约了刺绣型微带线的应用
随着文化输出的全球化趋势日益加剧和国际文化形态竞争的日益激烈,彰显创意内核、创新价值的创意产业集群的发展程度已成为衡量国家地区综合竞争力的重要指标,对拉动地区经济,传播国家意识形态具有重要作用。以好莱坞影视产业为例,其不仅位列美国三大经济支柱之一,而且在全世界范围内塑造美国价值,彰显美国影响。广泛的协同创新是创意产业集群的重要特点,集群企业的协同发展模式,如知识共享、上下游产业化合作等则是国内外学
碳碳键构成了有机化合物的基本骨架,因此如何高效地构建碳碳键是合成化学的核心科学问题之一。目前,过渡金属催化碳碳键偶联反应是有机化学的一个研究热点。近些年来过渡金属催化不饱和烃的碳官能团化反应是构建碳碳键的有效手段之一。该反应可以从简单原料出发高效地构建一个或者多个新的碳碳键,从而得到取代的烷基或烯基化合物。尽管该领域取得了重要进展,但这类反应仍面临反应活性以及选择性调控等许多方面的挑战。因此发展新
大气压辉光放电(APGD)产生的低温等离子体已经广泛应用于表面改性,生物医学和薄膜沉积等研究方向。其放电过程不需要真空系统,适合于工业中的连续处理,然而大气压下的辉光放电相较于低气压放电需要较高的击穿电压,放电稳定性和均匀性不易控制,这限制了大气压辉光放电的应用范围,因此大气压等离子体源开发和特性的研究成为当前低温等离子体的研究热点之一。大气压辉光放电激励源的重复频率在千赫兹到兆赫兹的范围,当其在
移动机器人定位问题一直是控制和信号处理领域中的一个具有挑战性的研究方向。在移动机器人定位系统中,一些新的由传感器不同特性导致的现象(主要有测量异常值和由传感器能量不足引起的测量丢失现象)的出现和不同类型通信协议的使用使现有的移动机器人定位算法已经不再适用,给移动机器人定位问题带来了新的挑战。因此,针对传感器不同特性约束和不同类型的通信协议,需要为移动机器人定位问题设计新的解决方案,这不仅可以丰富和
全球每年肌腱损伤数量高达3000多万,手术是该类疾病主要的治疗方式,缝合线是手术治疗中不可或缺的医疗器械,用于肌腱固定和皮肤缝合。稳定的肌腱断端固定和功能重建是肌腱修复的目标。鉴于可吸收材料降解过程中力学性能大幅衰减而无法满足肌腱修复的高强度要求,不可吸收缝合线仍是肌腱修复的主体材料,以新一代超高分子量聚乙烯(UHMWPE)缝合线为代表,但其临床使用效果并不理想,主要表现为结点安全性差、再撕裂率高
癌症由于其高发病率和致死率,已经成为全球性的医学难题。“早发现,早治疗”是降低其发病率和致死率的有效策略。近年来,纳米医学作为纳米科技和药物科学相结合的产物,为癌症的精准诊断与高效治疗带来了新的契机。例如,可将诊断和治疗两个分离的过程/功能集成,构建诊疗一体化的纳米平台,用于实时、精准诊断病情并同步治疗。其关键技术是构建一个合适的纳米载体平台整合治疗剂和/或造影剂并高效地输送到病灶部位。在众多纳米
烯烃和炔烃作为重要的化工原料和有机合成原料,因其廉价易得性及高反应活性,在有机合成发展中占有十分重要的地位。烯烃和炔烃的双官能团化反应可以一步合成多位点反应产物,将结构简单的起始原料转化为含有生物活性或药物活性的复杂化合物,因此受到科学家的广泛关注。其中通过廉价金属催化烯烃和炔烃自由基启动的方式实现双官能团化反应,目前已经取得一系列卓越的研究成果。但是如何调控自由基反应活性,实现烯烃和炔烃化学和区
人体神经与肌细胞等均表现为细长的纤维状形态,具有优异的信号传输、环境传感、防御保护等生理功能。经体内天然纤维启发,构筑结构、功能仿生的新型智能纤维材料,是当前的研究热点。水凝胶纤维即是一类优异的仿生材料,其可兼具水凝胶高含水、软弹等类组织功能特性,以及纤维高长径比、各向异性等结构优势,因而在组织工程、生物医药、柔性传感与智能驱动等领域具有广泛的应用前景。然而,大部分水凝胶纤维力学强度仍较低、溶胀不
以N-甲基吗啉-N-氧化物(NMMO)水溶液为溶剂制备再生纤维素纤维的Lyocell技术,因资源和环保的优势而被誉为最有前景的纤维素纤维再生工艺。随着Lyocell工艺不断成熟,Lyocell纤维产能和产量也逐年提升,功能化和差别化Lyocell新产品的开发将成为未来的重要方向,其中原液添加法制备着色Lyocell纤维具有工艺流程短、印染废水少、纤维色牢度高等优点;然而,颜料对溶剂NMMO稳定性及