特征空间中基于半遗传稀疏表示的图像识别

来源 :智能科学与技术学报 | 被引量 : 0次 | 上传用户:iours
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经典的稀疏表示分类(SRC)通常是基于求解L1最小化问题的。SRC在原始输入空间中求解L0范数最小化问题,无法很好地获取数据中的非线性信息。为了解决这一问题,应用非线性映射将原始输入数据映射到一个新的高维特征空间,并提出了一种新的基于L0范数的表示方法。在所提方法中,表示测试样本的字典包含两个部分:第一部分固定在测试样本的近邻;第二部分的训练样本通过半遗传算法(SGA)来选择,利用表示误差确定第二部分的表示字典。在所提方法中,如果训练样本和已确定的测试样本的近邻产生最小表示误差,那么这些训练样本将被
其他文献
本文研究了基于神经网络随机梯度下降法的手写数字识别方法。首先,阐述了基于MNIST手写数字图像的神经网络识别模型;其次,分析了基于神经网络随机梯度下降法的手写数字识别方法的实现步骤;最后,完成的实验表明该方法的识别准确率较高。
期刊
深度学习需要用到大量有标签的数据,即使在大数据时代,能用的有标签数据也不多,从而需要将深度学习与半监督学习结合起来。目前,全连接层已被证实,在迁移学习中可以起到很好的作用。在迁移学习的背景下,针对半监督分类问题,笔者基于marginGAN生成对抗网络使用了基于Dropout算法的全连接神经网络作为分类器,分类器的损失函数增加了拉德马赫正则项,验证了拉德马赫在半监督分类任务中的有效性。
期刊
目的:为了提高肺部疾病的临床诊断准确率及其手术成功率,需要对肺气管的影像进行准确的分割。方法:提出一种全新的针对肺气管图像的三维图像分割算法,将深度学习中的对抗生成网络结构(GAN)、密集连接网络模型(Dense Net)以及多尺度连接(Multi Scale)结构应用到临床三维图像的分割中。结果:该方法可以从读取数据块中做到像素级的分割,根据相对坐标位置对分割结果进行投票,结合最大联通分量后处理
期刊
为了提高带式输送机运行效率并降低设备能耗,提出一种基于计算机视觉技术的带式输送机智能调速控制系统,并在1506运输大巷带式输送机中进行工业应用。结果表明:(1)将计算机视觉技术应用到输送机煤流量监测中具有监测点布置便捷、监测结果可信度高等优点,同时也可为后续矿井带式输送机无人值守提供一定基础。(2)将模糊控制应用到带式输送机智能阶梯调速中,依据运输的煤炭变化情况制定合理的煤流量、运输速度区间,不仅
期刊
针对目标检测模型过大且计算复杂而导致其无法应用于无图形处理器嵌入式终端的问题,通过改进YOLO算法,提出一种基于深度学习的水面目标检测模型压缩方法.采用带有深度可分离卷积和轻量级注意力模型的改进网络替代特征提取网络DarkNet,通过多尺度特征融合进行模型压缩,引入k-means++算法与Mish激活函数,保证模型压缩后的准确度.试验结果表明,YOLOv3-MobileNetV3网络模型较YOLO
期刊
为解决视频目标跟踪过程中目标框和预测框边界不重叠情况下无法优化的问题,提出了一种距离交并比(distance intersection over union, DIOU)回归的孪生网络目标跟踪算法.通过孪生网络和区域建议网络(region proposal network, RPN)保持实时效果,将距离交并比引入回归分支,结合重叠率和中心点距离构建损失度量,加快模型训练的收敛速度,为边界框提供更直
期刊
随着AI技术、算力和数据量的快速发展,使得大量视频数据的"受众"已不再是人,而是机器和算法。通过目标分析等算法使得视频中嵌入的信息发挥了越来越大的价值。图像在从"给人看"转变成"给机器看"为主。"给机器看"可以实现海量视频的快速分析,
期刊
本课题结合迁移学习策略,设计了一种适用于纸病图像的小样本深度卷积神经网络分类器。首先冻结VGG16网络卷积层的前7层卷积层参数,微调后面的卷积层,完成纸病特征的提取;其次改进用于分类的全连接层,使其满足纸病分类的需求;最后在训练过程中采用迁移学习策略,提高训练效率。结果表明,该方法能够提高纸病识别效率及精度,并进一步加强纸病识别功能。
期刊
非负矩阵分解(NMF)已经得到了广泛应用。但NMF更注重数据的局部信息,忽略了数据的全局信息,而在有噪声图像的分类问题上,数据的全局信息往往比局部信息更具鲁棒性。为了提高算法的鲁棒性,结合数据的局部与全局信息,并且考虑低秩表示的特性,提出了一种新的非负监督低秩鉴别嵌入算法,此算法假设数据存在噪声,将数据分解为干净数据与噪声数据,并通过L_1范数对噪声矩阵进行稀疏约束,增强对噪声的鲁棒性。此外,该算
期刊
针对视网膜疾病种类繁多、病灶位置不固定等特点,提出一种基于深度卷积集成网络的视网膜多种疾病筛查和识别方法。首先,根据视网膜眼底图像裁剪掉两侧黑色边框,并去除图像中的噪声,以降低对眼底图像的干扰,提高图像的清晰度;之后,通过对处理完成的视网膜眼底图像使用裁剪、旋转等数据增强方法来扩增数据集;再建立基于深度卷积神经网络的模型进行特征提取,并在网络模型微调后完成视网膜疾病筛查和识别任务,最终将多个模型的
期刊