单目图像/视频深度信息估计技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wulanshaobu911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能技术的迅猛发展,自动驾驶、3D显示以及机器人逐渐走入了人们的视野并开始影响着人们的生活。在上述相关领域中,如何获取准确的场景深度信息成为了研究的重点。当前针对单目图像/视频深度估计任务的主要方法是通过深度卷积神经网络(DCNNs)来学习彩色图-深度图数据库中存在的图像域信息到深度域信息的映射关系。但是,当前该领域的主流算法存在着如下三个问题:(1)在单目视频深度估计任务中,将面向图像的卷积神经网络模型运用到视频任务时,预测得到的深度图序列存在严重的时空不一致问题,影响3D视频的合成效果。(2)在单目图像深度估计任务中,当前的模型无法通过一套模型参数适应室内室外不同的场景,限制了模型的实用性与鲁棒性。(3)当前的单目深度估计网络模型具有较大的存储消耗以及计算消耗,限制了模型在移动端设备上的使用。本文针对上述三个问题分别提出了有效的解决方案。针对单目视频深度估计任务,本文提出了一种循环条件随机场网络模型。该模型将时空条件随机场与常规的卷积神经网络进行结合,能够有效地构建深度序列中存在的时空依赖关系,保证了预测结果的准确性与时空一致性。针对多场景类别单目深度估计任务,本文提出了一种基于注意力机制的深度分类网络。在该模型中,注意力模块通过统计场景的特性增强特征的判别能力,深度分类模块将深度回归任务转化为分类问题减少了模型的优化难度。室内室外两种数据库下的实验结果证明了本文模型的有效性。针对移动端的单目深度估计问题,本文提出了一种轻量化的单目深度估计模型。该模型采用深度可分离卷积替代传统卷积,同时使用了一种新颖的分段权重损失函数进行训练。实验结果显示,该模型在参数量较少的情况下取得了良好的效果。
其他文献
钢琴专业一直是综合性大学艺术院校的重要专业之一。当前钢琴专业教学,在生源质量、招生考试、课程设置、教学内容、学生实践能力等几个方面都存在一些问题。因此,我们应该在招
绍兴会稽山,我可爱的家乡。会稽山,中华九大名山之一,古代帝王加封祭祀的著名镇山,浙东唐诗之路的门户,山脉呈南西-北东走向,层峦叠翠,绵延近百公里,构筑了家乡雄伟壮丽的脊梁。
公元13世纪,元代医学家危亦林创造了悬吊复位法治疗脊柱骨折,这是中国伤科发展史上的一个创举,它解决了脊背骨折治疗的大难题,也为其它部位骨折的治疗创造出一种新方法,比英
“优选公交,绿色出行”宣传周拉开帷幕9月18日,市交通局、市公安局、市总工会联合组织公交客运企业、地铁运营公司共100余人举行了形式简洁、主题鲜明的大连“公交出行宣传周
通过组建的离网风电.网电互补抽油机供电模拟试验装置,对供电系统及其测控系统性能进行试验研究。结果表明:该试验系统能准确模拟风力机发电的实际运行情况和抽油机的载荷变化,风
介绍了肥西县规模化畜禽养殖业的污染现状,分析了污染防治中存在的问题,并提出具体的防治对策,以期控制污染源,保护农村环境。
影片《奇幻森林》自2016年4月上映以来赢得了全球观众的广泛关注与好评。在电影呈现的诸多主题中,狼孩毛克利在森林中与动物们和谐共处,协力战胜恶势力,共同创造一个和平安宁
洛阳师范学院是一所省属普通高等师范本科院校,位于千年帝都、牡丹花城一一洛阳,文脉传承,底蕴丰厚。学校北依洛河,碧水东流,杨柳堆烟,流传着洛神宓妃的美丽传说;西望关林和世界文化
藏传佛教一位密宗掘藏师在1963年带着自己的信徒,从干诚章嘉山峰开始探索一种与乌托邦相似的地域。本文通过分析掘藏师德修林巴的背景及其探索活动,表明了伏藏行为本身的意义
转介对控制和减少大学生心理危机事件的发生具有重要的现实意义。大学生心理危机干预体系中的转介机制,包括心理危机干预领导小组工作职能的行使、心理危机干预转介知识的宣传