【摘 要】
:
单应性估计问题是指由存在单应性变换的两个平面估计出对应的变换矩阵。单应性估计在许多计算机视觉相关的科研与应用中起到重要作用,比如图像拼接、相机校准、即时定位与地图构建以及增强现实等。传统的单应性估计算法技术上通常由关键点检测、关键点匹配以及单应性估计三个步骤完成估计任务。伴随着硬件算力的提升以及卷积神经网络优秀的自动提取图像特征能力,基于卷积神经网络的单应性估计算法快速发展,然而利用深度学习进行单
论文部分内容阅读
单应性估计问题是指由存在单应性变换的两个平面估计出对应的变换矩阵。单应性估计在许多计算机视觉相关的科研与应用中起到重要作用,比如图像拼接、相机校准、即时定位与地图构建以及增强现实等。传统的单应性估计算法技术上通常由关键点检测、关键点匹配以及单应性估计三个步骤完成估计任务。伴随着硬件算力的提升以及卷积神经网络优秀的自动提取图像特征能力,基于卷积神经网络的单应性估计算法快速发展,然而利用深度学习进行单应性估计时却有着一个不可忽视的问题:卷积神经网络提取出的深度图像特征无法直接映射到单应性变换上。单应性变换是一个点到点的变换,直接使用神经网络学习深度特征与单应性变换之间的映射关系取得的效果并不理想,目前基于深度学习的方法在估计精度方面甚至无法超越一些基于关键点匹配的传统方法。
本文提出了一种将图像对转换到光流域再由光流估计单应性的算法框架。由于光流描述的是像素点运动的信息,而单应性变换则是点到点变换关系,利用图像间的光流来估计单应性,则可以解决图像本身的深度特征与单应性不对应的问题。利用先估计图像对间光流再由光流估计单应性的方法可以有效地提升估计精度。
对于基于卷积神经网络的单应性估计算法估计精度较低的问题,本文提出了一种通用的迭代预测方法来提升估计精度。单应性估计问题具有一个特殊性质,即存在单应性变换的两个图像,对其中一个图像施加任意一个单应性变换后得到的图像依然与另一个图像间存在着单应性变换。通过利用该性质,经过多次的变换与预测,最后将每轮预测结果的累加作为最终预测结果。通过这种迭代预测的方式在已有算法的基础上进一步提升了估计精度。
本文利用真实图像生成了一个统一测试集,并在该测试集上进行一系列对比实验,通过这些实验的结果验证了本文提出的算法的可行行与有效性。
其他文献
研究背景与目的:甲型流感病毒依据其致病性强弱分为高致病性或低致病性,以往爆发的H5N1,H7N9和H7N7高致病性甲流疫情,死亡率高达30%以上。而低致病力甲流病毒pdm09H1N1爆发,感染患者大部分可以自行痊愈,死亡率低于0.05%。高致病性甲流的致病机制一直是研究的热点,大量研究发现免疫系统对病毒感染的过度反应,是甲型流感病毒的主要致病机制。高致病性甲型流感病毒可以引发“细胞因子风暴”,宿主
DNA测序技术的发展有着短暂且丰富的历史,在短短的40多年中有着众多飞跃式的发展。从Sanger的电泳法测序技术,以高成本、低通量、长读长、高精度等特点打开生物测序的大门;到NGS大规模平行测序,以低成本、高通量、短读长、高精度等特点成为生物测序的中流砥柱;再到目前正引领新潮流的单分子实时合成测序如PacBio和Nanopore,以高通量、超长读长、低精度等特点开创生物测序的新时代。DNA测序技术
结核分枝杆菌(Mycobacterium tuberculosis,Mtb)是结核病(Tuberculosis)的胞内致病菌,其在人体内的宿主细胞主要是巨噬细胞。Mtb和宿主之间蛋白-蛋白的相互作用在感染和免疫中起着重要作用。本研究利用Mtb强毒株H37Rv和弱毒株H37Ra分别刺激巨噬细胞,提取巨噬细胞全蛋白与Mtb全蛋白芯片相互作用,筛选出了283个差异蛋白,这些差异蛋白可能与Mtb的毒性相关
端粒是真核生物线性染色体末端的核糖核蛋白结构。因为其结构的特殊性,位于端粒或亚端粒区域的基因通常处于转录表达沉默状态。在裂殖酵母中,由dsDNA结合蛋白Taz1,ssDNA结合蛋白Pot1,端粒酶招募蛋白Ccq1以及桥连蛋白Rap1-Poz1-Tpz1构成的保护复合物-Shelterin在染色体末端端粒稳态的维持、异染色质状态的维持以及末端结构的保护等过程中有重要作用。这些蛋白在结构和功能上与人源
光电化学电池将太阳能转化成电能和化学能(如氢能),能有效地解决能源和环境污染问题,显示了可持续发展的前景。本文研究了可将太阳能转换成电能的液结太阳能电池和可将太阳能转换成化学能的光电解电池。纳米TiO薄膜电极作为上述电池的光阳极,通过优化获得了较高光电压和光电流的太阳能电池,并且利用太阳能电池得到的电能,作为光电解池的偏压,光解水制得氢气;另外还设计了新型的离子隔膜双室光电解池,无需偏压即可制得氢
复杂电磁环境下的卫星通信链路受到来自低轨卫星或地面站的特定干扰后,会降低其通信的有效性和可靠性。因此,在干扰存在的情况下提高通信的可靠性和有效性是卫星通信领域的研究热点和难点问题。本文从深度学习的角度入手,把深度神经网络结构与LDPC码的并行迭代译码结合起来,来研究在音调干扰信号存在的情况下基于神经网络的译码算法。 本文首先对音调干扰信号进行了分析,并研究了音调干扰信号的时域特征以及频域特征,建
RTK(Real-time kinematic)是一种载波相位差分技术。该技术是通过利用两个观测站载波相位观测值进行实时差分处理的一种方法,将基站得到的观测数据发送到用户站,实现求差解算坐标。然而,RTK定位是以用户站和基站误差基本相同为基础的,用户必须位于基站10-15公里范围内。随着基线的增长,GPS误差的空间相关性会渐渐减弱,导致定位精度降低。因此,为了能够实现高精度RTK定位作用于更长的距
舌诊是中医中的一项重要诊断方法。中医认为,舌头与人体的脏器密切相关,人体的某些疾病可以从舌头反映出来。因此,通过舌图像诊断疾病的技术一直受到广泛的关注,大量的计算机化舌诊技术被提出,然而由于不同疾病患者的舌图像之间的差异非常细微,所以如何准确地对不同疾病的舌图像进行分类是一项难题。而先前的计算机化舌诊技术都是手动提取舌象的特征,如颜色、纹理和红点,然后使用传统的分类器对这些特征进行分类,而手动的特
近年来,人们对生活质量的要求日益升高,健康舒适的居住环境成为人们关注的重点,环境噪声投诉占环境投诉的比例也明显升高。然而,如今的噪声监测只有声压级一个指标,忽略了声源这一对人耳有重要影响的因素,相同声压级的音乐声与汽车噪声相比,人们显然对前者有更高到的接受度。针对这一现象,本文借鉴声音景观理论,采用主观评价的方法对不同声源组合的噪声划分等级,并利用深度学习算法识别出环境声音的噪声等级,给环保工作者
随着科学技术的发展,近几十年来大数据成为重要的研究课题,如何将数据转化为有用的知识,是人们越来越关心的问题。基于效用的模式挖掘技术综合考虑模式的内部特性和外部因子,可以从数据库中发现高效用的模式知识,给决策者提供决策支持,在商业中具有广泛的应用。此外,大数据的采集、维护和使用已在科学研究、经济建设和社会生活等领域产生了积极的作用。但是大数据意味着数据会更加复杂,通常呈现多源异构、不确定性的特点,同