【摘 要】
:
基于孪生网络的目标跟踪算法将跟踪问题建模为目标特征和搜索区特征之间的匹配问题.匹配程度通常是根据二者特征之间的相关响应来衡量.目前该衡量方式仍存在以下局限:一方面,对目标的不同区域使用的是相同的特征提取器,没有考虑到目标内部和轮廓处的区别;另一方面,在特征之间相关性的求解过程中,模板空间结构是固定的,无法很好地应对目标形变时的情况,鲁棒性较差.为解决上述问题,提出了一种双分支孪生网络目标跟踪算法SiamDAH(Double Adjust Head Siamese Network for Object Tr
【机 构】
:
中国科学院 上海微系统与信息技术研究所 仿生视觉系统实验室,上海 200050;中国科学院大学,北京 100049;中国科学院 上海微系统与信息技术研究所 仿生视觉系统实验室,上海 200050
论文部分内容阅读
基于孪生网络的目标跟踪算法将跟踪问题建模为目标特征和搜索区特征之间的匹配问题.匹配程度通常是根据二者特征之间的相关响应来衡量.目前该衡量方式仍存在以下局限:一方面,对目标的不同区域使用的是相同的特征提取器,没有考虑到目标内部和轮廓处的区别;另一方面,在特征之间相关性的求解过程中,模板空间结构是固定的,无法很好地应对目标形变时的情况,鲁棒性较差.为解决上述问题,提出了一种双分支孪生网络目标跟踪算法SiamDAH(Double Adjust Head Siamese Network for Object Tracking),其中双分支结构旨在考虑目标内部区域和轮廓处的表征需求差异.此外,提出了一种改进的逐像素相关模块,有效降低了传统相关操作时模板结构固定带来的问题.在GOT-10k数据集上的实验结果表明,提出的算法在AO、SR0.5、SR0.75指标上较基准算法分别实现了3.4%、7.0%、2.3%的提升.在NVIDIA RTX 2080Ti上速度可达90 frame/s.
其他文献
随着深度学习的不断发展,唇语识别领域的研究取得了重大进展,涌现了许多唇语识别的深度学习算法.依据识别对象的连续性,将唇语识别分为孤立唇语识别和连续唇语识别,并对各识别任务的深度学习方法进行了详细和深入的分析总结.从孤立唇语识别的深度学习方法和连续唇语识别的深度方法两个方面介绍了主流唇语识别方法,并对各方法的优缺点和性能进行比较;对不同数据集下代表性方法的特点和性能进行比较,对两类方法的优缺点和适用范围进行阐述;讨论了唇语识别方法存在的问题和挑战,并对唇语识别方法的研究趋势进行了展望.
针对证据组合过程中修正权重的确定问题,提出了一种综合考虑证据间关联关系和自身不确定度的改进修正权重确定方法,实现了对待组合证据的有效修正.基于对证据信息随机性和不具体性的阐述,得到了证据综合不确定度的度量方法.结合基于改进冲突度的相似性权重和基于综合不确定度的可靠性权重,确定了改进的修正权重.应用Dempster组合规则对修正后的加权平均证据进行有效组合.算例分析结果表明,所提方法能够充分利用证据信息,解决证据冲突,组合结果更为客观、准确,可信度更高.
针对委托股权证明(Delegated Proof of Stake,DPoS)共识机制系统中节点活跃度不高、错误节点剔除不及时、记账收益分配不合理等问题,提出了一种改进方案.改进方案主要改进了DPoS的计票机制和激励机制.改进的计票机制将节点的更多信息纳入了计票范围,使得选票能够更全面地反映节点的信用情况.根据节点的投票记录,动态调整节点选票的权重加快错误节点的剔除.对于激励机制的改进分为投票激励和记账激励两个部分,投票激励针对所有参与共识的节点给予相应的激励,激励系统中的节点积极参与投票.记账激励是根据
近年来预付费消费模式倍受商家和消费者的青睐,在娱乐健身、教育培训、商超零售等服务业中得到广泛应用.现有预付卡管理中存在商家欺诈高发、商家违约频发、监管不善等诸多问题,难以保障消费者的权益.当前,基于区块链的智能合约技术具有去中心化、安全性高、可验证等特性,可用来有效管理预付卡,为解决预付卡管理存在的问题提供了新思路.因此提出了一种基于区块链的公平预付卡管理方案,消费者和商家通过与智能合约的交互完成交易,利用智能合约的暂存价值完成预付款的管理.消费者和商家共同确认消费成功后,由智能合约自动结算本次消费费用给
为提升隐写分析的效率和准确率,并适应多尺寸输入图像,提出一个基于高效特征融合的可变尺寸图像隐写分析模型.在预处理层中,将经空域富模型的多阶高通滤波器初始化的多尺寸卷积核加入网络学习中,以提升模型的收敛效率和检测性能;在特征提取层中,采用特征融合思想,设计两个由Ghost瓶颈层、残差模块、密集连接模块组成的子网络,并融合输出的抽象隐写语义特征和非线性的高维隐写特征,以获得隐写特征的依赖性信息,增强模型的特征表达能力;采用改良版空间金字塔池化以自适应可变尺寸的图像样本,并丰富隐写特征的多样性.经仿真分析可知,
话题演化分析是舆情监控的研究热点之一,面向微博热点话题进行演化分析,对于网络用户以及网络监管部门都有很重要的现实意义.针对在线词对主题模型(On-line Biterm Topic Model,OBTM)新旧主题混合、冗余词概率相对较高的问题,对OBTM进行改进,提出基于话题标签和先验参数的OBTM模型(Topic Labels and Prior Parameters OBTM,LPOBTM).根据微博热点话题的话题标签,将微博文本集区分为含话题标签和不含话题标签的两类数据集,并设置不同的文档-主题先验
近年来无锚框的目标检测算法逐渐被应用于SAR舰船检测,其中FCOS算法摆脱了对锚框参数设置的依赖,对多尺度、多形态舰船检测的鲁棒性更好,但仍存在两个问题:第一、该算法直接进行逐像素点回归,因搜索空间过大、目标回归困难导致检测不够准确;第二、其中特征金字塔对低层特征利用仍有不足导致小目标大量漏检.针对上述问题基于FCOS进行改进,通过增加特征增强网络构建了二阶段无锚框检测算法.该网络作为第一阶段对检测过程进行精细化引导,同时增强了舰船特征表达能力.通过引入更多特征并增加跳跃连接改进特征金字塔,提高了低层特征
为了解决实际中动态表情识别存在的局部遮挡问题,提出一种基于并行Gan网络的有遮挡动态表情识别方法.构建一个并联网络P-IncepNet进行上下文特征提取,利用条件对抗网络训练了一个处理不同程度遮挡的图像修复网络.将构建的并联网络与LSTM进行级联,充分利用并联网络的特征提取和LSTM的时空信息获取能力,训练得到一个更具鲁棒性的动态表情识别网络.实验结果表明,在CelebA和MMI数据集上训练的局部遮挡补全网络对中小程度遮挡的补全优于其他网络;构建的级联表情识别网络对于不同程度遮挡的识别结果显示,修复表情图
针对自然场景文本检测中存在的文本检测信息缺失、漏检的问题,提出了嵌入注意力机制的自然场景文本检测方法.利用Faster-RCNN目标检测网络和特征金字塔网络(FPN)作为基本框架;在区域建议网络(RPN)中嵌入注意力机制并依据文本的特点改进锚点(anchor)的设置,精确了文本候选区域;重新设定损失函数的作用范围.实验结果表明,该方法有效地保证文本检测信息的完整性,较之现有方法明显地提高了文本检测的召回率和准确率,能够应用于文本检测的实际任务中.
目标跟踪是无人机的关键技术之一.无人机目标跟踪容易因相机运动、尺度变化等场景的影响,导致跟踪漂移或丢失.提出一种多帧监督的相关滤波无人机目标跟踪算法,加入多帧信息,根据视图的像差监督响应图变化率,有效地提高跟踪器的识别能力.采用裁剪矩阵引入真实负样本,并加入多个历史帧信息提高滤波器的鲁棒性.采用欧几里德范数定义响应图的像差,通过监督像差的变化防止跟踪漂移,得到目标的准确位置.根据相似度进行目标模型更新.在UAV123和VisDrone2019数据集上与其他算法对比实验.结果显示该算法在相机运动、尺度变化等