【摘 要】
:
大型车辆的身份识别在交通系统中十分重要,但由于牌照位置、拍摄角度以及污渍的影响,目前的车牌检测方法并不能很好的得到其牌照信息。而通过检测车厢后部喷涂的车牌放大号对其车牌号码进行获取是解决这一问题的有效途径,由于车牌放大号的字符间距比较大,当前的文本检测方法容易出现误检,因此本文提出一种联合视觉与规则评价的车牌放大号检测识别方法。利用注意力模块对特征进行增强,构建整体检测、掩膜检测与字符检测识别的多
论文部分内容阅读
大型车辆的身份识别在交通系统中十分重要,但由于牌照位置、拍摄角度以及污渍的影响,目前的车牌检测方法并不能很好的得到其牌照信息。而通过检测车厢后部喷涂的车牌放大号对其车牌号码进行获取是解决这一问题的有效途径,由于车牌放大号的字符间距比较大,当前的文本检测方法容易出现误检,因此本文提出一种联合视觉与规则评价的车牌放大号检测识别方法。利用注意力模块对特征进行增强,构建整体检测、掩膜检测与字符检测识别的多分支网络对车牌放大号整体与字符分别进行获取,同时针对车牌放大号的字符特点与命名规则设计评价模块。将评价模
其他文献
近年来随着数据规模和算力水平的提高,深度学习及相关预训练模型如ResNet等在图像识别领域取得了较快进展,其在多类应用场景的指定任务上均取得了良好表现。然而如何提高深度学习模型如ResNet等预训练模型的泛化能力,仍然是图像识别领域亟需解决的关键问题。目前通常的做法是通过网络结构的优化,或是数据集的扩充来改善模型性能,然而这些方法往往依赖于大量数据和大量时间/算力的网络结构修剪和二次训练,模型训练
本文提出一种自适应感受野卷积神经网络结构,简称ARFN(Adaptive Receptive Field Network)。通过卷积核的自主选择机制来实现感受野的动态调整,更大程度上获取残差网络低层特征的空间信息并与高层特征进行自适应融合,弥补高层特征空间信息不足的缺陷。同时,在残差块中加入一种轻量的新型注意力机制,通过一维空洞卷积实现特征通道间适当的非线性交互,有效地学习各通道特征的权重。相较于
由于物联网设备异构性、数据海量性、交互动态性和信息强隐私性等特点,现有访问控制方案面临着授权粒度、动态性和策略管理等方面的严峻挑战,本文提出基于下一代访问控制的授权方案,以图的方式描述访问控制策略,实现细粒度动态授权,同时为用户提供良好的操作管理体验,文中通过智能家居领域示例说明其在物联网中的适应性。另外,为解决其授权执行效率问题,以更好适应物联网实时动态性的特点,提出支持多策略类决策的决策算法,
Hyperspectral remote sensing is well-known for its extraordinary spectral distinguishability to discriminate different materials. However, the cost of hyperspectral image (HSI) acquisition is much hig
深度度量学习根据特定的度量损失函数对神经网络进行不同的训练,直接学习原始图像空间到语义特征嵌入空间的非线性投影。针对现有代理锚损失函数在不考虑数据分布的情况下,将同一类正样本压缩到嵌入空间中的某个代理锚点,而造成同类样本相似结构丢失的问题,本文提出了一种新的基于排序驱动策略的代理锚损失函数。该损失函数使用了排序列表损失中对样本对进行排序的思想,将正样本排在负样本之前,并通过约束正样本对的距离小于阈
针对三维人脸重建算法的精度不足和三维人脸标注样本数量较少的问题,本文引入了多尺度特征提取融合模块和双重注意力机制模块,提 出了一种以单幅人脸图像作为输入、利用编解码网络预测重建分量的自监督三维人脸重建算法。引入的多尺度特征提取融合模块有助于获取更丰富的多尺度人脸特征信息,编解码网络中引入双重注意力机制模块,进一步提升网络的特征提取能力,同时单幅图像输入的自监督方法绕开了传统方法中对于数据集的高要求
针对立体环视图像拼接准确度的难点,提出了一种基于物体坐标系的曲面投影图像拼接算法。根据实际应用场合建立合适的三维模型,对图像进行基于物体坐标系的纹理映射,将三维模型划分为融合、非融合区域,将原始图像映射到非融合区域,对于拼接融合区域,结合模型特点,设计了一种基于角度信息的加权平均融合算法,对拼接后的图像进行颜色校正,消除光照不均、亮度及色度差异现象。算法通过车载立体环视图像的生成验证其有效性,实验
FPGA(Field Programmable Gate Array)凭借其高并行和可定制化的特点,可以解决目标检测网络结构复杂、计算量大和存储开销高等问题。本文基于FPGA验证平台研究并实现了YOLO(You Only Look Once)系列神经网络的加速计算模型。首先采用动态定点量化方法降低了数据存储和传输量。然后针对YOLO模型中两类计算开销大的典型卷积层,采用了流水线,循环展开,模块融合
针对目前行人多属性识别算法识别精度不高的问题,利用行人属性之间的内在关联关系,基于“特征提取+回归”的思想,提出了一种基于深度卷积神经网络的行人多属性协同识别方法。该方法首先对多个行人属性标签进行组合编码,得到一个标签组合向量;然后采用基于通道注意力机制的ResNet50作为骨干网络提取行人图像的深度特征;最后,设计了一个包含3个全连接层的神经网络结构来建立标签组合向量与行人深度特征之间的映射模型
基于计算机视觉的裂纹自动识别算法在飞机全尺寸疲劳试验中具有较好的工程应用前景。但由于飞机结构构型多样、疲劳试验环境复杂,直接应用现有的目标检测算法会存在较高的误判率。因此,本文提出一种基于关键部位状态对比的裂纹识别方法,以人脸识别模型FaceNet为基础,利用对比机制消除结构表面纹理、划痕等干扰因素的影响,并通过对裂纹数据结构和特征分布规律的分析,对FaceNet模型的样本生成规则、网络架构和损失