基于格式塔组织原则和场景图的信息图表信息块识别算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:a_b_c_d
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息图表(如幻灯片、技术文档等)是办公软件的重要组成部分,是一种通过信息块展示信息的可视化图表。对信息图表进行信息挖掘,可以获取大量的数据、知识等,具有重要的研究价值。信息块识别任务是挖掘信息图表中信息的重要一步。现有的信息块识别工作利用空间接近性原则,将元素分组为多个信息块,然而,现有工作存在两个重要不足:第一,现有工作忽略了信息图表的颜色和结构特征,从而导致在识别信息块时容易产生元素遗漏的现象;第二,信息图表中元素之间的关系是识别信息块的重要依据,而现有工作没有考虑信息图表中每一对元素之间的关系,以及同一个信息块内的多个元素之间的相互关系,导致这类工作难以完整地捕获所有元素的信息块关系,进而影响了信息块识别精度。为了解决这两个不足所带来的信息块识别错误,本文提出了基于空间和结构特征的信息块识别(Information Block Recognition based on Spatial and Structural Features,IBR-SSF)模型,该模型通过提取信息图表的颜色信息以及相同信息块内元素的结构相似性特征,对信息图表元素进行信息块分组,能有效解决前述工作的第一个不足。同时,本文在IBR-SSF模型的基础上,将信息图表示为场景图,提出了基于场景图的信息块识别模型(Information Block Recognition based on Scene Graph,IBR-SG),该模型基于格式塔组织原则(空间接近性、颜色相似性和结构相似性原则)对元素进行分组,可以有效地解决现有工作的两个不足。现有的信息图表数据集不是为信息图表中的信息块识别而设计的,为了评估本文的模型在信息块识别任务中的效果,本文构造了一个用于信息块识别任务的新数据集,并针对信息块识别任务提出了三个不同粒度的评价指标。实验表明,本文提出的模型可以有效识别信息图表中的信息块。
其他文献
对于偏远山区、海岛等与电网联系薄弱地区,电网供电能力不足且可靠性较低。由于电网升级投资规模较大,有效利用当地风、光等可再生能源,建设风光柴储微电网具有较高的可行性。如何更好地发挥微电网接纳新能源发电的能力,提高微电网电能质量,是迫切需要解决的技术问题。而谐波谐振作为可以使谐波源的负面影响成倍放大的电能质量问题,在微网中应受到足够的重视。本文以风光柴储独立微电网系统为研究对象,对不同情况下微网系统的
视网膜母细胞瘤易感基因(Rb1,retinoblastoma)为癌变过程中的重要肿瘤抑制基因,该基因也参与调控体内的多个生理过程,主要包括细胞周期、细胞凋亡以及细胞分化等进程。Rb1主要通过与E2F1/DP1的相互作用调控细胞周期运转和细胞凋亡过程,而Rb1与肌源调控因子(myogenic regulatory factor,MRF)之间的相互作用在骨骼肌发育过程中也至关重要。Rb1可以抑制骨骼肌
随着现代社会的高速发展,各种基础设施的建设对土体的承载能力与变形控制有了更高的要求,在土力学中,怎样科学又准确地计算地基沉降量一直是待解决的难题。目前国内最常用的沉降计算方法为国家规范推荐的分层总和法,由于规范法经验系数取值为0.2-1.4,误差较大,是一种半理论半经验的沉降计算方法,且计算是采用通过室内试验获得的压缩模量,并不能反映土体的原状性。依据现场原位试验而建立的切线模量法可以克服室内试验
随着我国城市发展模式的转变,城市更新成为很多大城市发展的主要方向。使用后评价对指导城市更新具有重要意义,一方面可以对城市更新的效果进行科学地评价并发现存在的问题,另一方面可以将评价结果反馈给策划端,促进规划设计标准的完善和质量的提升,有效指导未来的实践活动。然而,城市更新项目具有时间周期长、空间范围广、利益群体复杂和目标多样等特点,问卷调查和专家访谈等传统评价方法的局限性日益显现。随着智能终端的普
作为下一代重点发展的光伏发电技术,有机光伏电池(OPVs)以质量轻、柔性、半透明、可溶液加工等优势备受关注。得益于非富勒烯受体材料的突破性进展,近年来有机光伏器件效率迅速提升,其最高能量转换效率已超过18%,展现出广阔的发展和应用前景。对于高性能非富勒烯受体分子的设计,目前研究重点主要集中在中心核构建、侧链工程、π桥单元修饰和端基修饰四个方面,其中侧链工程作为一种可快速改变分子光电性能以调控活性层
语义分割任务是计算机视觉中最重要的任务之一,该任务要求将输入图像的每个像素都匹配到一种语义类别中。在实际应用中,语义分割在自动驾驶和机器人导航视觉等领域发挥着重要作用。近年来,语义分割备受关注,研究人员基于卷积神经网络(CNNs)提出了各种针对语义分割任务的技术方案,这些方案取得了良好效果,但也普遍存在一个共同的缺点:网络参数过多,计算成本高。因此,设计一个有效的且小尺寸的实时语义分割模型意义重大
缆索承重桥梁在交通运输事业中发挥着重要作用。拉索作为缆索承重桥梁的主要承重构件,容易受到交通荷载和外界环境的作用而产生损伤,从而导致拉索承载能力下降。拉索失效造成的工程事故时有发生,对社会经济发展产生严重影响,因此必须重视对缆索承重桥梁拉索索力的健康监测。传统的索力测试方法属于接触式方法,需要人工布置索力测试传感器,存在测试成本高和测试效率低等问题。本文开展基于计算机视觉的索力测试方法研究,可以为
在常见的半监督分类算法中,基于图的半监督分类算法在近年来取得了不俗的分类效果。传统的基于图的半监督算法有两个主要缺点。首先,表示相似度矩阵的图的是在分类器训练之前预先定义好的,这样的图并不能很好地利用分类器训练和相似度矩阵学习之间的交互作用。其次,当处理带噪声或者冗余特征的高维数据集时,在原始高维数据空间构建的图是不合适的,甚至使得分类效果下降。在本文中,我们提出了一种面向高维数据的基于图的半监督
随着汽车智能化与网联化的发展,汽车ECU的功能和结构愈加复杂,车内ECU的数量多达100个以上,对ECU的软件升级提出了更高的要求。诊断刷新系统作为整车诊断的关键部分,对车载ECU的软件升级起到重要的作用。设计安全、可靠、高效的诊断刷新系统可以大幅度提升ECU软件升级的性能。目前基于CAN总线的诊断刷新系统因其带宽不足,使得ECU刷新效率低、更新时间长。针对以上问题,本课题依托广州某整车厂诊断开发
目前由于城市地下空间的不断开发,既有下卧盾构隧道面临的安全风险越来越大,上方的基坑工程施工难免会对其产生一定的影响。因此不仅要满足基坑自身的稳定性要求,还要重点关注管片结构的变形,防止开裂破坏的风险。尤其对于变形敏感的软土地区,准确的预测基坑卸荷引起盾构隧道的附加内力与变形以及分析不同工程措施控制变形的效果具有很大的现实意义。针对这一问题,采用理论解析及数值模拟的方法开展了以下工作:(1)在基坑卸