【摘 要】
:
近年来,随着计算机硬件和软件性能的不断提高,三维模型采集设备和建模技术也得到了迅速的发展。三维模型天然的立体空间结构使其能更加全面地表征物体,因此被广泛用于智能制造、数字娱乐、辅助医疗等领域。目前,三维模型数据量日益庞大,如何高效准确地从三维模型数据库中检索出目标模型,成为一个亟需解决的问题。在对目前主流三维模型检索和分类算法进行充分调研的基础上,本文主要深入研究了如何有效地利用三维模型多视图的相
论文部分内容阅读
近年来,随着计算机硬件和软件性能的不断提高,三维模型采集设备和建模技术也得到了迅速的发展。三维模型天然的立体空间结构使其能更加全面地表征物体,因此被广泛用于智能制造、数字娱乐、辅助医疗等领域。目前,三维模型数据量日益庞大,如何高效准确地从三维模型数据库中检索出目标模型,成为一个亟需解决的问题。在对目前主流三维模型检索和分类算法进行充分调研的基础上,本文主要深入研究了如何有效地利用三维模型多视图的相关性和上下文信息,并且基于有监督或者无监督深度学习方法提出以下三种基于视图的三维模型检索/分类算法:1)基于多视图树状结构编码的模型检索和分类算法(Multi-View Tree Structure Learning for 3D Model Retrieval and Classification,MVTS)。为了更充分地挖掘视图之间的相关性信息,MVTS基于视图之间的相似性得分构建了得分矩阵,并由此构建视图最大生成树,然后将最大生成树转换为左子右邻树。随后,本章利用双向树状LSTM编码方法对视图之间的上下文信息以及树状结构的空间信息进行编码。编码后的视图特征将通过树状注意力机制计算得到它的权重值。视图编码特征的加权之和将作为模型特征,用于后续检索或者分类任务。2)基于局部和全局三元组的无监督模型检索和分类算法(Local and Global Triplets based Siamese Network,LGTSN)。为了解决监督学习需要昂贵数据标注的问题,本章提出一种基于无监督学习的三维模型特征提取网络LGTSN。在LGTSN中,分别基于模型视图序列的自相关信息和模型近邻信息进行视图级别和模型级别的聚类,并根据聚类结果分别构建局部三元组和全局三元组。此后通过三元组损失函数对网络进行训练,使其能提取模型具有区分度的特征。3)基于视觉图和上下文图融合的三维模型检索算法(Visual Graph and Contextual Graph Fusion based 3D Model Retrieval,VGCGF)。VGCGF利用计算机图论的相关理论,提出一种无监督的相似度匹配方法。该方法基于模型之间的视觉相似性构建了视觉图,并且基于模型之间的上下文相似性构建了上下文图。随后通过图融合步骤更全面地衡量模型之间的相似性,将模型相似性匹配转换为图匹配,从而得到更准确的检索结果。以上的三个方法都在大型三维模型数据库上实施了充足的对比实验以验证其有效性,并通过消融实验和超参数实验验证了对应网络模块的有效性。
其他文献
从天气预报到股指预测,时间序列预测在方方面面都起着至关重要的作用。然而,实际场景下的时间序列往往具有极强的非线性和较低的可预测性,传统方法往往差强人意。同时,随着社交网络的发展,越来越多的用户在网络上表达自己的观点,这些观点中的情感信息可以辅助解决相关的预测问题。在目前的研究中,用户的情感信息尚未得到充分利用。为了实现及时准确的预测,本文出了情感分析和深度学习相结合的方法——融合情感分析的时间序列
显著性对象检测旨在着重标示图像或视频场景中在语义层面上引人注意或感兴趣的区域或对象。显著性对象检测可以作为预处理步骤,为其他复杂的计算机视觉应用任务提供帮助。当前,它已经被广泛应用于目标跟踪、图像分割、目标检测等任务中。显著性检测目前依旧是具有挑战的计算机视觉任务,因为具有复杂形状和任意大小的显著物体通常难以精确地检测,尤其是在杂乱的背景和复杂的场景中。由于考虑到基于单一层次特征预测显著物体的缺陷
实际生活中采集的图像由于光照环境、图像采集设备、拍摄人员的不稳定性通常存在不同程度的低光照或光照不均匀等情况,制约了其在跟踪和检测等计算机视觉任务中的作用。因此通过图像增强算法提高图像的对比度和信息丰富程度,并降低噪声具有重要的现实意义。现有的图像增强方法往往存在亮度提升不明显、亮度提升过强、图像暗区域细节恢复不完全、图像亮区域细节丢失等问题。针对这些问题,本文提出了两种图像增强算法分别实现亮度的
在当前互联网和知识经济时代,社会对于高质量人才培养的重视不断加强。因此,高职院校需要探索适应新形势下学生教育管理工作的方法,并在此基础上进行创新。文章建议高职院校应注重提高教师队伍整体素质、树立以人为本的教育管理观念、构建高效系统的学生教育管理机制、建立健全高质管用的学生自治组织、提升学生管理工作的信息化水平。如此,高职院校才能真正成为培养高质量人才的重要基地。
目标检测和实例分割分别提供目标级和像素级的图像目标以增强图像整体感知能力,成为计算机视觉重要的任务,且被广泛应用于行人检测、视频监控、零部件识别定位、智能医疗诊断等领域。由于各领域任务对于图像目标感知的程度要求日趋提高,传统图像感知算法的速度与精度已无法达到其要求。因此近年来基于深度卷积神经网络的实例分割和目标检测一直成为业界的研究热点并取得了突破性进展,但往往在精度和速度上无法兼顾。本文分别致力
高质量的深度图像或视频有着广泛的应用场景,例如姿态识别,机器人导航,立体影视等。然而,现有的深度采集设备大多存在分辨率低的问题,限制了深度图的应用。到目前为止,这个问题仍然难以通过提高硬件性能的手段解决。因此,如何通过图像重建方法提高深度图的分辨率已成为一个研究热点。已有的深度图重建方法通常对等间隔均匀采样的深度图进行重建,但是,受频率混叠和高频信息丢失的影响,均匀采样的方式并不是最有利于深度重建
随着大数据时代的到来,视频数据已成为学术研究和实际应用中不可或缺的一部分,视频的分析与处理技术受到越来越多的关注。视频异常事件检测技术用于检测视频帧中是否包含异常事件,是视频分析与处理领域的研究热点之一。然而,异常样本往往不易获取,这影响了异常检测模型的泛化能力,也给异常检测技术带来了巨大的挑战。本文从两个角度解决此问题,即模型优化角度与异常样本构造角度。首先,从模型优化角度出发,本文提出了一种基
目的:探讨复方鳖甲软肝片联合慢肝解郁胶囊治疗代偿期肝硬化的临床疗效及安全性。方法:将100例入住我院的代偿期肝硬化患者按照奇偶数字法随机地均分为对照组与观察组,各为50例。两组均给予保肝抗病毒治疗,观察组在此基础给予复方鳖甲软肝片联合慢肝解郁胶囊治疗。比较两组临床疗效、治疗前后肝功能相关指标变化及不良反应发生情况。结果:(1)对照组临床总有效率为76.00%,显著小于观察组(94.00%)(P<0
通信体制时常会采用信道编码技术来达到增强通信的可靠性的目的。目前已有的一系列纠错码里,Turbo码凭借优越的性能,在地面通信系统与卫星通信系统中得到了广泛的应用。由于空间通信系统往往需要具备在线升级的能力,其常用的数字信号处理的器件是FPGA,尤其是可重配置的SRAM型FPGA。但是,基于SRAM的FPGA很容易遭受空间中的辐照效应的影响,其中最常见的情况是单粒子翻转。因此,当Turbo译码器在空
近年来随着深度学习的不断发展与普及,利用卷积神经网络对受损图像进行复原的研究越来越热门。单图像去雨方法能够对有雨图像进行预处理,在去除雨线的同时恢复出图像原有的特征信息,增强图像处理系统在不同气象条件下的鲁棒性。现有的单图像去雨方法取得了一定的研究成果,但仍存在雨线残留、细节丢失和去雨实时性差等问题。本文对现有的单图像去雨方法进行了介绍和分析,并在这些方法研究的基础上,结合非局部特征融合与图像修复