【摘 要】
:
针对目前行人多属性识别算法识别精度不高的问题,利用行人属性之间的内在关联关系,基于“特征提取+回归”的思想,提出了一种基于深度卷积神经网络的行人多属性协同识别方法。该方法首先对多个行人属性标签进行组合编码,得到一个标签组合向量;然后采用基于通道注意力机制的ResNet50作为骨干网络提取行人图像的深度特征;最后,设计了一个包含3个全连接层的神经网络结构来建立标签组合向量与行人深度特征之间的映射模型
论文部分内容阅读
针对目前行人多属性识别算法识别精度不高的问题,利用行人属性之间的内在关联关系,基于“特征提取+回归”的思想,提出了一种基于深度卷积神经网络的行人多属性协同识别方法。该方法首先对多个行人属性标签进行组合编码,得到一个标签组合向量;然后采用基于通道注意力机制的ResNet50作为骨干网络提取行人图像的深度特征;最后,设计了一个包含3个全连接层的神经网络结构来建立标签组合向量与行人深度特征之间的映射模型,在一个统一的网络框架下就可以同时对行人的多种属性进行准确识别。在行人属性公共数据集PETA和RAP上的
其他文献
营养胁迫是限制植物生长发育的重要因素之一,而具有20~24个核苷酸的microRNA是一类发挥关键作用的非编码小RNA,通过与特定靶基因结合,在转录后水平或通过翻译抑制实现对靶基因表达的抑制,进而在植物营养胁迫的调控中发挥重要作用。过去在模式植物拟南芥中对于miRNA介导的养分胁迫研究较多,近些年来水稻、玉米、大豆等不同物种中miRNA参与养分胁迫的报道在增加。本研究综述了miRNA在不同植物中对
随着深度神经网络的广泛应用,其安全性问题日益突出。研究图像对抗样本生成可以提升神经网络的安全性。针对现有通用对抗扰动算法攻击成功率不高的不足,提出一种在深度神经网络中融合对抗层的图像通用对抗扰动生成算法。首先,在神经网络中引入对抗层的概念,提出一种基于对抗层的图像对抗样本产生框架;随后,将多种典型的基于梯度的对抗攻击算法融入到对抗层框架,理论分析了所提框架的可行性和可扩展性;最后,在所提框架下,给
近年来随着数据规模和算力水平的提高,深度学习及相关预训练模型如ResNet等在图像识别领域取得了较快进展,其在多类应用场景的指定任务上均取得了良好表现。然而如何提高深度学习模型如ResNet等预训练模型的泛化能力,仍然是图像识别领域亟需解决的关键问题。目前通常的做法是通过网络结构的优化,或是数据集的扩充来改善模型性能,然而这些方法往往依赖于大量数据和大量时间/算力的网络结构修剪和二次训练,模型训练
本文提出一种自适应感受野卷积神经网络结构,简称ARFN(Adaptive Receptive Field Network)。通过卷积核的自主选择机制来实现感受野的动态调整,更大程度上获取残差网络低层特征的空间信息并与高层特征进行自适应融合,弥补高层特征空间信息不足的缺陷。同时,在残差块中加入一种轻量的新型注意力机制,通过一维空洞卷积实现特征通道间适当的非线性交互,有效地学习各通道特征的权重。相较于
由于物联网设备异构性、数据海量性、交互动态性和信息强隐私性等特点,现有访问控制方案面临着授权粒度、动态性和策略管理等方面的严峻挑战,本文提出基于下一代访问控制的授权方案,以图的方式描述访问控制策略,实现细粒度动态授权,同时为用户提供良好的操作管理体验,文中通过智能家居领域示例说明其在物联网中的适应性。另外,为解决其授权执行效率问题,以更好适应物联网实时动态性的特点,提出支持多策略类决策的决策算法,
Hyperspectral remote sensing is well-known for its extraordinary spectral distinguishability to discriminate different materials. However, the cost of hyperspectral image (HSI) acquisition is much hig
深度度量学习根据特定的度量损失函数对神经网络进行不同的训练,直接学习原始图像空间到语义特征嵌入空间的非线性投影。针对现有代理锚损失函数在不考虑数据分布的情况下,将同一类正样本压缩到嵌入空间中的某个代理锚点,而造成同类样本相似结构丢失的问题,本文提出了一种新的基于排序驱动策略的代理锚损失函数。该损失函数使用了排序列表损失中对样本对进行排序的思想,将正样本排在负样本之前,并通过约束正样本对的距离小于阈
针对三维人脸重建算法的精度不足和三维人脸标注样本数量较少的问题,本文引入了多尺度特征提取融合模块和双重注意力机制模块,提 出了一种以单幅人脸图像作为输入、利用编解码网络预测重建分量的自监督三维人脸重建算法。引入的多尺度特征提取融合模块有助于获取更丰富的多尺度人脸特征信息,编解码网络中引入双重注意力机制模块,进一步提升网络的特征提取能力,同时单幅图像输入的自监督方法绕开了传统方法中对于数据集的高要求
针对立体环视图像拼接准确度的难点,提出了一种基于物体坐标系的曲面投影图像拼接算法。根据实际应用场合建立合适的三维模型,对图像进行基于物体坐标系的纹理映射,将三维模型划分为融合、非融合区域,将原始图像映射到非融合区域,对于拼接融合区域,结合模型特点,设计了一种基于角度信息的加权平均融合算法,对拼接后的图像进行颜色校正,消除光照不均、亮度及色度差异现象。算法通过车载立体环视图像的生成验证其有效性,实验
FPGA(Field Programmable Gate Array)凭借其高并行和可定制化的特点,可以解决目标检测网络结构复杂、计算量大和存储开销高等问题。本文基于FPGA验证平台研究并实现了YOLO(You Only Look Once)系列神经网络的加速计算模型。首先采用动态定点量化方法降低了数据存储和传输量。然后针对YOLO模型中两类计算开销大的典型卷积层,采用了流水线,循环展开,模块融合