【摘 要】
:
四维光场相机被认为是优秀的成像设备,具有广阔的发展前景。其和传统的相机相比,不仅可以记录每个像素的强度,并且可以记录光的方向,提供了丰富的结构信息。通过获取光场中的有效信息,许多基于视觉的应用得以进一步发展,如虚拟现实、重聚焦、三维重建等。而基于光场的三维重建,可以准确地恢复场景的三维结构,所以逐渐成为了国内外研究的热点。本文将基于光场的三维重建分为两个部分进行介绍:在同一个光场中,包含了针对同一
论文部分内容阅读
四维光场相机被认为是优秀的成像设备,具有广阔的发展前景。其和传统的相机相比,不仅可以记录每个像素的强度,并且可以记录光的方向,提供了丰富的结构信息。通过获取光场中的有效信息,许多基于视觉的应用得以进一步发展,如虚拟现实、重聚焦、三维重建等。而基于光场的三维重建,可以准确地恢复场景的三维结构,所以逐渐成为了国内外研究的热点。本文将基于光场的三维重建分为两个部分进行介绍:在同一个光场中,包含了针对同一个场景不同视角的图像,并且不同视角之间的基线较小。针对这种情况,本文利用极面图像进行深度提取,根据致密的视差图进行场景单面的稠密重建。为了进一步获取场景完整的结构,本文对多个光场的三维重建进行研究。结合光场极面图像的特性,针对同一场景不同拍摄角度的光场图像进行特征点的匹配,建立不同光场之间的联系,生成场景的多面稀疏点云。本文第一个研究内容为光场极面图像的深度提取算法:颜色约束旋转平行四边形算子。对于现有的方法而言,在面对复杂遮挡、噪声、混叠、纹理不充分等情况时,估计的深度图的准确率会产生较大的误差。所以本文基于已有的鲁棒深度提取算法旋转平行四边形算子,设计了不同的颜色约束,利用极面图像的结构信息,通过斜率估计进行深度恢复。首先,利用不同视角之间的颜色一致性,排除遮挡区域的影响。之后,在本文中设计了一种新的高斯融合直方图,结合直方图邻组信息,改善了在有噪声和弱纹理场景的提取结果。最后,提出了一种可供选择的动态直方图均衡,缓解直方图对于组数的敏感性。实验结果表明,与其他最新深度估计方法进行比较,本文提出的方法在合成与真实数据集均能达到更好的结果,并且可以处理具有不同种类的视差和不同角度分辨率的光场。本文第二个研究内容为基于光场极面图像的特征:尺度不变极线特征。在不同光场之间,特征的提取是三维重建的基础步骤,特征的数量和匹配的准确度直接影响重建的结果。因此,如何获取更多包含有效信息的优秀特征成为了亟需解决的问题。现有的光场特征存在多视角重复提取,特征鲁棒性差,匹配效果差等问题,所以,在本文中,利用光场极平面图像,通过构造极平面图像栈,将水平与竖直的极平面图像栈与中心视角图像中的特征信息进行融合,并进行筛选。实验表明,与近年基于光场的特征相比,本文提出的特征可以更好地捕获图像中的有效信息,同时具有更好的匹配能力。最后,本文利用光场相机进行数据采集,采集针对同一场景的多视角光场图像,导入开源框架中进行三维重建,并进行了重建结果的展示。
其他文献
目标检测技术是计算机视觉中的核心技术,被广泛应用在智能视频监控、自动驾驶、航空监测等领域。同时,随着遥感技术的不断成熟,可获取的遥感数据量急剧增加。因此,遥感图像目标检测技术逐渐成为研究热点,其指的是设计一个目标检测器,可以高效地识别出遥感图像中的感兴趣目标且对其进行定位。然而,此领域始终面临着许多严峻的难题。首先,由于图像涵盖的物体广泛且杂乱,造成了检测时复杂背景干扰的问题。然后,图像中的小目标
短句语义相似性判别作为自然语言处理的基础任务,对于下游的数据挖掘、信息检索、机器翻译等任务具有极其重要的作用。在目前基于匹配聚合框架的语义相似性模型中,序列对齐的过程中只考虑了单个特征空间的语义信息,并且对于全局信息的利用不够充分。另外,将序列转化为固定维度的向量的单步预测方式也会造成序列中重要信息的丢失。解决上述问题对于模型性能提升具有积极的作用。本文针对上述两方面的问题,提出基于混合全局信息的
近年来,作为一种能展现360度全方位视角的媒介,全景视频在监控、场景展示、赛事直播等领域展现了独特的魅力,逐步走进大众视野。全景视频具有视角广阔、高分辨率、高帧率、数据量大的特点,为存储和传输带来困难,因此亟需有效的全景视频编码方案。在全景视频编码过程中,投影方法与编码算法是最关键的两个要素。本文围绕全景视频的特性,提出了如下几种投影方法,以适配随后的全景视频编码:(1)提出近似均匀采样的少畸变双
随着互联网技术的高速发展,网络中的数据量呈指数式增长。在信息过载的情况下,用户难以及时、准确地发现感兴趣的商品。推荐系统通过分析用户与物品的相关特征,从而为用户过滤大量无关信息,推荐符合其偏好的商品。推荐系统的准确性常因两大问题受到限制,一是评分数量过少导致的数据稀疏问题,二是新物品或新用户加入导致的冷启动问题。本文主要针对这些问题对推荐系统进行研究,以提高推荐结果的准确性。本文立足于推荐系统中与
病理图像检查被誉为诊断癌症、预后和指导治疗的金标准,同时也是连接诊断和治疗的关键环节。它通过观察活体组织结构和细胞病变特征做出诊断,其结果相比其他诊断方法更加权威,是目前最主要也最可靠的癌症诊断方法。随着数字成像设备和病理切片制作技术的不断发展,病理医生可以借助先进的成像设备扫描活体组织样本,并通过计算机观察其生成的全切片图像。然而,全切片图像的分辨率极高,并且图像内容复杂,涵盖了百万数量形态多样
文字记载了几千年人类的文明和历史,是人类信息中最重要的载体。直至今日,现实生活中的众多场景都使用文字形式来进行信息交互。而图像是记录文字信息最快速的载体。在快节奏的生产生活中,信息的电子化处理已成为一种不可逆转的趋势。识别并理解图像中的文字信息就具有很高的研究价值和广泛的应用场景,能使生活变得越来越智能化和便捷化。虽然文字识别技术已经发展了多年,但是由于中文汉字的字符类别多、字形复杂、词频不均衡,
可逆水印,作为一种特殊的数字水印技术,需要提取方在正确提取水印后无失真的恢复原始载体。这种可逆性对于医学、军事和法律等具有高保真要求的特殊领域至关重要。但是,含水印图像在信道的传输过程中会产生一定的质量损失,这就要求可逆水印同时可以抵抗一定程度的攻击,比如JPEG压缩和噪声等非恶意攻击。因此,鲁棒可逆水印(Robust Reversible Watermarking,RRW)技术应运而生。鲁棒可逆
随着无线通信技术的不断发展,车联网正朝着异构化的趋势不断演进。异构车联网将短距离通信、蜂窝网等技术结合在一起,满足了不同场景下的车载业务需求。面对车联网中复杂的网络拓扑和严苛的通信条件,如何保证车辆移动时网络连接的稳定性,提升车联网技术辅助下车辆的驾驶安全是目前学术界研究的热点。早期的异构车载网络大多依靠远程云服务器进行海量数据的分析与决策,由于传输距离较远很难对一些时延敏感型数据进行实时处理。利
近年来,随着互联网和多媒体技术的飞速发展,数字信息以图像、视频、文字等形式被广泛传播。多媒体数据易被非法获取和篡改,从而导致严重的信息安全问题,例如版权纠纷、数据泄露等。作为多媒体数据版权保护的一种有效方法,数字水印技术在不影响视觉效果的情况下,将标识信息嵌入到多媒体数据中,从而利用提取的嵌入信息确认版权。本文针对最广泛使用的多媒体数据载体,即图像和视频,研究了不同嵌入规则下的鲁棒盲水印方法,优化
涉案财物管理是刑事诉讼程序中一项十分重要的内容。当前,我国对于涉案财物采用“实物移送,各自管理”的管理模式。这种模式容易出现业务衔接不畅、司法效率过低以及涉案财物被非法侵占等问题,其原因在于公安机关、检察院和法院等涉案财物管理单位之间往往会产生信息孤岛效应,导致信息传递与财物转移失去一致性。本文针对这一问题进行分析,利用区块链技术构建了涉案财物跨部门转移的协同管理过程,重点研究了共识的形成机制。本