【摘 要】
:
智慧教育即教育信息化,是利用现代信息技术的新一代教育模式,智慧行为分析是智慧教育系统的核心组成.在面对复杂的教室应用场景时,针对传统的行为识别分类算法的精确性与时效性都存在严重不足的问题,提出了一种基于分离与注意力机制的图卷积(Depthwise Separable Attention Graph Convolutional Network,DSA GCN)骨架动作识别算法.首先,为解决传统算法在通道域信息聚合天生不充分的难题,通过逐点卷积进行多维通道映射,将时空图卷积对输入骨骼序列的原始时空信息的保护能
【机 构】
:
西安电子科技大学计算机科学与技术学院 西安710071
论文部分内容阅读
智慧教育即教育信息化,是利用现代信息技术的新一代教育模式,智慧行为分析是智慧教育系统的核心组成.在面对复杂的教室应用场景时,针对传统的行为识别分类算法的精确性与时效性都存在严重不足的问题,提出了一种基于分离与注意力机制的图卷积(Depthwise Separable Attention Graph Convolutional Network,DSA GCN)骨架动作识别算法.首先,为解决传统算法在通道域信息聚合天生不充分的难题,通过逐点卷积进行多维通道映射,将时空图卷积对输入骨骼序列的原始时空信息的保护能力与深度可分离卷积在空间和通道特征学习上的分离能力相结合,以增强模型特征学习与抽象表达性.其次,采用多维度融合的注意力机制,在空间卷积域利用自注意力与通道注意力机制来提升模型的动态敏感性,在时间卷积域利用时间与通道注意力融合法来增强对关键帧的判别力.实验结果表明,在NTU RGB+D和N-UCLA两个大型数据集上,DSA-GCN都获得了优异的性能和效能表现,证明了模型对通道域信息聚合能力的提升.
其他文献
深度伪造可以将人的声音、面部及身体动作拼接,从而合成虚假内容,用于转换性别、改变年龄等.基于生成对抗式图像翻译网络的人脸性别伪造图像存在容易改变无关图像域、人脸细节不够丰富等问题.针对这些问题,文中提出基于改进Cy-cleGAN的人脸性别伪造图像生成模型.首先,优化生成器结构,利用注意力机制与自适应残差块提取更丰富的人脸特征;然后,借鉴相对损失的思想对损失函数进行改进,提高判别器的判别能力.最后,提出基于年龄约束的模型训练策略,减小了年龄变化对生成图像的影响.在CelebA和IMDB-WIKI数据集上进行
在计算机视觉领域中,三维人脸重建是一个具有研究价值的方向,高质量地重建出三维人脸在人脸识别、防伪、游戏娱乐、影视动画和美容医疗等领域具有重要的意义.近二十年来,虽然基于单幅图像的三维人脸重建领域已经取得很大的进展,但使用传统算法进行重建的结果仍会受到人脸表情、遮挡、环境光的影响,并且会出现重建效果精度不佳和鲁棒性不足等问题.随着深度学习进入三维人脸重建领域,各种优于传统重建算法的方法相继出现.文中首先重点介绍了基于深度学习的单幅图像三维人脸重建算法,将算法按不同的网络架构分为4类,并对各类最具有代表性的方
传统的人体骨架动作识别算法采用手动构建拓扑图的方式来建模包含在多个视频帧中的动作序列,并针对性地学习每个视频帧以反映数据变化,这容易造成计算代价大、网络泛化性低和灾难性遗忘等问题.针对上述问题,提出了基于动态拓扑图的人体骨架动作识别算法,使用持续学习思想动态构建人体骨架拓扑图.将具有多关系特性的人体骨架序列数据重新编码为关系三元组,并基于长短期记忆网络,通过解耦合的方式学习特征嵌入.当处理新骨架关系三元组时,使用部分更新机制动态构建人体骨架拓扑图,并采用基于时空图卷积网络的骨架动作识别算法来实现动作识别.
深度神经网络在很多领域表现出色,但是研究表明其很容易受到对抗样本的攻击.目前针对神经网络进行攻击的算法众多,但绝大多数攻击算法的攻击速度较慢,因此快速生成对抗样本逐渐成为对抗样本领域的研究重点.AdvGAN是一种使用网络攻击网络的算法,生成对抗样本的速度极快,但是当进行有目标攻击时,其要为每个目标训练一个网络,使攻击的效率较低.针对上述问题,提出了一种基于生成对抗网络的多目标攻击网络MTA,在进行攻击时MTA仅需要训练一次就可以完成多目标攻击并快速生成对抗样本.实验结果表明,MTA在CIFAR10和MNI
肿瘤的精确诊断对患者的治疗方案选择和预后预测都非常重要.病理学诊断被认为是肿瘤诊断的“金标准”,但是,病理学发展目前仍然面临着巨大的挑战,如病理医生的缺乏,特别是在欠发达地区和小医院,这将导致病理医生长期超负荷工作,同时,病理诊断严重依赖于病理医生的专业知识和诊断经验,病理医生的主观性导致了诊断不一致性的激增.全切片扫描图像(Whole Slide Images,WSI)技术和深度学习方法的突破性进展为计算机辅助诊断和预后预测提供了新的发展机遇.苏木精伊红(Hematoxylin Eosin,H&E)染色
近年来,以生成对抗网络为基础的从文本生成图像方法的研究取得了一定的进展.文本生成图像技术的关键在于构建文本信息和视觉信息间的桥梁,促进网络模型生成与对应文本描述一致的逼真图像.目前,主流的方法是通过预训练文本编码器来完成对输入文本描述的编码,但这些方法在文本编码器中未考虑与对应图像的语义对齐问题,独立对输入文本进行编码,忽略了语言空间与图像空间之间的语义鸿沟问题.为解决这一问题,文中设计了一种基于交叉注意力编码器的对抗生成网络(CAE-GAN),该网络通过交叉注意力编码器,将文本信息与视觉信息进行翻译和对
随着深度学习理论的发展,深度神经网络取得了一系列突破性进展,相继在多个领域得到了应用.其中,尤其以图像领域中的应用(如图像分类)最为普及与深入.然而,研究表明深度神经网络存在着诸多安全隐患,尤其是来自对抗样本的威胁,严重影响了图像分类的应用效果.因此,图像对抗样本的研究近年来越来越受到重视,研究者们从不同的角度对其进行了研究,相关研究成果也层出不穷,呈井喷之态.首先介绍了图像对抗样本的相关概念和术语,回顾并梳理了图像对抗样本攻击和防御方法的相关研究成果.特别是,根据攻击者的能力以及防御方法的基本思路对其进
在遥感图像超分辨率重建领域,大部分数据集缺少成对的图像用于训练,当前的方法主要是通过双三次插值的方式来获取低分辨率图像,因退化模型过于理想化导致在处理真实低分辨率遥感图像时效果较差,基于此,文中提出了一种自然场景下真实遥感图像的超分辨率重建算法.针对缺少成对图像的数据集的问题,构建了一种更合理的退化模型,将成像过程中的退化先验知识(如模糊、噪声、降采样等)随机混洗,以模拟自然场景下低分辨遥感图像的生成过程,生成逼真的低分辨率图像用于训练;同时,改进了一种基于生成对抗网络的超分辨率重建算法,在生成网络中引入
视频超分辨率是根据给定的低分辨率视频序列恢复其对应的高分辨率视频帧的过程.近年来,VSR在深度学习的驱动下取得了重大突破.为了进一步促进VSR的发展,文中对基于深度学习的VSR算法进行了归类、分析和比较.首先,根据网络结构将现有方法分为两大类,即基于迭代网络的VSR和基于递归网络的VSR,并对比分析了不同网络模型的优缺点.然后,全面介绍了VSR数据集,并在一些常用的公共数据集上对已有算法进行了总结和比较.最后,对VSR算法中的关键问题进行了分析,并对其应用前景进行了展望.
在分子可视化中使用光线追踪渲染图像能够极大地促进研究人员对分子结构的观察和感知,但现有的光线追踪方法存在实时性能不足以及渲染质量不佳的问题.文中提出了一种光线追踪棋盘渲染方法.该方法利用棋盘渲染技术对光线追踪方法进行优化,其流程主要划分为重投影、渲染、重建和孔填充4个阶段,在各阶段中,提出了针对棋盘渲染的改进,包括光线追踪前向重投影、分子着色包围盒、动态图像重建方法和八邻居插值填孔策略.在6个拥有不同原子数量的分子上与目前的先进方法进行对比,实验结果表明,所提方法整体的实时帧率明显高于同样基于CPU计算的