论文部分内容阅读
随着计算机技术的快速发展,形状匹配技术已经成为计算机视觉等领域的研究热点,很多形状匹配方法成功应用于人脸识别、文本识别等问题。同时,形状匹配也是地理特征认知识别的重要因素之一,如何衡量两个目标形状之间的相似程度取决于目标本体的特征和受众的主观认知,是一个空间认知的过程。建筑物要素是地理空间要素的重要组成部分,具有直角转折、轴线对称等明显的视觉特征,其形状匹配在综合化简、数据融合等问题中都是重要基础。形状匹配的基本流程包括提取一定的形状表示因子和在该形状表示下的相似性度量,已有的形状匹配方法多基于形状某些方面的特征进行描述,而没有综合考虑形状表示之间的关系和认知角度,通过人为定义权重等方式对不同的认知角度和数值尺度的形状表示进行融合缺乏合理的解释。当前深度学习技术在计算机视觉、自然语言处理和机器智能等依赖于人类认知的领域取得重大成就,深度学习能够基于人类的数据经验挖掘其中的认知特征。因此,本文以空间认知为出发点,从不同的认知角度构建一系列建筑形状的表示特征,基于深度学习的特征挖掘和知识发现能力,对建筑形状进行编码表示,从而实现符合视觉认知的形状匹配。具体地,本文的主要成果和创新点包括:(1)构建了不同认知角度的形状表示特征。在综合考虑建筑形状的本体特征、认知因素的基础上,构建一组建筑面要素的形状表示因子,包括形状区域的全局特征和基于形状轮廓的多尺度序列特征等,特征符合平移、尺度、旋转不变性,从不同的认知角度刻画了建筑形状。(2)基于深度学习构建建筑形状编码模型。模型基于seq2seq框架和自编码器的思想,通过非监督的方式对形状的基本特征进行非线性映射降维,并重构回原特征集,从而实现形状编码能力。通过该模型得到一个融合了不同认知角度形状编码,该编码是对原始形状表示的进一步抽象,用更低的维度表示形状本体与认知信息。(3)提出相应的形状相似性计算方法并验证分析。基于上述方法得到的综合性的形状编码库,以余弦相似度作为相似性度量的基准,同时考虑形状轮廓特征的旋转采样问题等,进行形状匹配的相似性计算。最后,设计模拟数据和真实数据的场景,通过相似度可视化分析、形状的检索和匹配实验验证形状编码的有效性,并作评述。结果表明,本文构建的形状编码模型能够构建具有认知意义的形状编码。该编码很好的表示了建筑面要素形状的全局和局部特征,符合视觉认知,能够用于度量形状间的相似性,对不同形状具备足够的区分能力,并完成形状的检索和匹配任务。基于不同认知角度的形状表示,深度学习模型能够挖掘其中本质特征,并实现特征融合和形状编码。同时,本文方法仍存在一些问题,具体地,该模型依赖于形状轮廓的多尺度特征,根据尺度的不同可能存在拟合局部轮廓的问题。总体来说,本文的建筑形状匹配方法能够完成建筑形状的识别和匹配任务,对深度学习在地理空间认知挖掘等方面具有一定参考价值。