【摘 要】
:
针对现有基于深度学习的视频追踪算法关注深层特征而忽略浅层特征以及追踪网络没有对每帧追踪结果进行检测的问题,提出基于校正神经网络的视频追踪算法。该算法包含追踪网络和校正网络。在追踪网络中,考虑到深层特征和浅层边缘特征的融合,设计一个多输入的残差网络,学习目标和对应的高斯响应图之间的关系,从而获得目标对象的位置信息。在校正网络中,设计浅层链式判别网络,将两个网络的追踪结果进行比较,根据比较结果对追踪网
论文部分内容阅读
针对现有基于深度学习的视频追踪算法关注深层特征而忽略浅层特征以及追踪网络没有对每帧追踪结果进行检测的问题,提出基于校正神经网络的视频追踪算法。该算法包含追踪网络和校正网络。在追踪网络中,考虑到深层特征和浅层边缘特征的融合,设计一个多输入的残差网络,学习目标和对应的高斯响应图之间的关系,从而获得目标对象的位置信息。在校正网络中,设计浅层链式判别网络,将两个网络的追踪结果进行比较,根据比较结果对追踪网络进行在线更新。本算法既考虑了深层特征,又避免了细节信息的丢失;同时,对追踪结果进行评判,防止网络更新中
其他文献
当今国民休闲时代,中国旅游从"景区旅游"向"全域旅游"发展。当前关于"全域旅游"规划的一系列本质问题亟需明确,进而才能使规划落到实处,发挥真正意义。以西双版纳过去10年的3个规划实践项目为探索路径,剖析各项目的战略定位、空间布局策略、保护建设措施等规划思路要点,并回访分析规划执行效果,最后从行为方式、资源角度、规划实施三方面的转变,阐释了全域旅游规划的实质性变革因素、空间体系结构以及其决定性优势。
随着我国经济的发展,社会的进步,科学技术水平的提升,时代形势的转变,5G通信技术的相关问题也渐渐引起了人们的重视。在物联网形势下,5G通信技术得到了较快的发展,某种意义上5G通信技术甚至会成为未来发展的主流,所以必须要对其进行合理的应用,真正发挥5G通信技术的作用,诠释5G通信技术的价值。据此,本文立足于物联网形势,对5G通信技术的应用问题进行了分析,希望能够对现实有所裨益。
Nonlocal self-similarity(NSS) is one of the most commonly used priors in computer vision and image processing. It aims to make use of the fact that a natural image often possesses many repetitive loca
本文,主要针对基于物联网云平台的河道水污染监测与治理系统的设计进行了一系列研究,采用图文并茂的形式,讲解了水污染检测系统总体架构设计,包括硬件及软件设计,希望为工作人员提供一定的帮助和支持。
物联网让万物互联互通,为了避免恶意设备对网络系统的破坏,必须采取有效的访问控制。通过提取网络流量特征作为设备指纹进行设备识别,只需耗费较少网络资源,成为了当前最有效的设备识别方法。然而,现有的设备识别算法准确率不高,尤其对于相似的两种设备,往往会出现分类重叠问题。该文提出了一种基于流量特征的二阶段多分类设备识别算法。当出现分类重叠问题时,即采用最大相似度比较算法进行二次分类。实验结果表明,该算法的
为了进一步提高人脸表情识别算法的准确性,提出一种融合双编码局部二值模式(DCLBP)算子和绝对梯度直方图(HOAG)算子的人脸表情识别方法,该方法首先利用DCLBP算子提取人脸图像的局部纹理特征,利用HOAG算子提取人脸图像的局部形状特征;然后,采用典型相关分析法(CCA)融合所提取的两种特征;最后,利用支持向量机(SVM)进行人脸表情分类。实验结果表明,与单一特征识别方法和级联特征识别方法相比,
强监督识别算法需要大量的人工标注信息,消耗较多的人力物力资源。为了解决上述问题,满足实际需求,提出了两种基于弱监督信息图像识别方法用于细粒度图像分类(FGVC)。一种是联合残差网络和Inception网络,通过优化卷积神经网络的网络结构提高捕捉细粒度特征的能力。另一种是对双线性CNN模型进行改进,特征提取器选取Google提出的Inception-v3模组和Inception-v4模组,最后把不同
汉字识别是人工智能与模式识别领域中重要的研究内容,针对现有的研究仍然存在着参数调整难度大、训练样本数少、不能识别所有常用字符等问题,提出了一种基于字符编码与卷积神经网络的汉字识别方法,首先通过查询字库得到所有字符信息,以utf-8编码方式与多种字体编码文件进行编码输出字符图像,再进行多种图像处理后得到数据集,并利用深度卷积神经网络进行训练识别,在网络训练中通过数据扩增、批标准化、RMSProp优化
目前基于互联网各类图像以及人工智能应用对图像数据质量较为敏感,但由于采集设备以及传输方式限制,导致图像质量受到非常严重影响,为了弥补图像数据质量损失和增强图像效果,提出一种并行交错上下采样网络(parallel interlaced up and down sampling network, PSUDN)作为一个解决该问题的更好的方案,利用并行的高分辨特征(high resolution feat
现有的同步定位与地图创建(SLAM)算法在动态环境中的定位与建图精度通常会大幅度下降,为此提出了一种基于动态区域剔除的双目视觉SLAM算法.首先,基于立体视觉几何约束方法判别场景中动态的稀疏特征点,接下来根据场景深度和颜色信息进行场景区域分割;然后利用动态点与场景分割结果标记出场景中的动态区域,进而剔除现有双目ORB-SLAM算法中动态区域内的特征点,消除场景中的动态目标对SLAM精度的影响;最后