【摘 要】
:
文字的出现,使得人类的思想文化等信息在时间维度上传之久远且在空间维度上传之广远。最近几年,无数的历史文档在历史学家的帮助下被电子化存储。通过研究一个时期的历史文档,人们能够对当时的风土人情、文化、气候等情况获得更加可信的了解。与此同时,随着互联网时代的到临和智能终端设备的普及,人们生活中的方方面面也以照片的形式被记录和保存,尤其是在手写笔记、备忘录、课堂和会议室的白板等场景。自动检测、识别并电子化
论文部分内容阅读
文字的出现,使得人类的思想文化等信息在时间维度上传之久远且在空间维度上传之广远。最近几年,无数的历史文档在历史学家的帮助下被电子化存储。通过研究一个时期的历史文档,人们能够对当时的风土人情、文化、气候等情况获得更加可信的了解。与此同时,随着互联网时代的到临和智能终端设备的普及,人们生活中的方方面面也以照片的形式被记录和保存,尤其是在手写笔记、备忘录、课堂和会议室的白板等场景。自动检测、识别并电子化存储这些场景中的手写文字信息有着丰富的应用场景,而一个鲁棒的文字检测系统是实现这一目标至关重要的第一步。时至今日,自然场景和历史文档中的手写文字检测仍是一个未被完全解决的问题,其面临着诸多困难和挑战。这些挑战可以归于以下几个方面:手写文字本身的多样性,例如不同的笔画宽度、字体大小颜色、较长的拖尾、行间重叠的笔划等;版面的多样性,例如行间批注、同一区域不同朝向的文字等;物理损毁,例如印透的墨迹等;复杂背景和拍照引入的畸变,例如遮挡、噪声、不均匀光照等。本文在深入调研相关领域的发展之后,根据手写文字独有的特性,分别开展了以下三个工作以解决已有方法的不足,从而可以有效检测自然场景和历史文档图像中的手写文字。(1)提出了一种基于连通区域的自然场景中的手写文字检测方法,即通过对候选文字连通区域进行方向估计从而实现多方向文本行检测。在我们这个工作开始之前,基于连通区域的方法多是利用手工设计的特征和规则将候选文字连通区域根据相似性聚集成行。这些算法限制了其对于短行、密集的多行或者朝向不同的多行的处理能力,而这些情况在手写文字的场景中较为常见。为了提高这些情况下的检测能力,我们提出一种基于候选文字连通区域方向的聚行算法。利用神经网络强大的信息抽取能力,我们通过引入丰富的上下文信息对候选文字连通区域进行方向估计和文字非文字分类,在得到方向信息的同时过滤掉困难负样本,从而实现复杂情况下多方向文本行的检测。(2)提出了一种基于文字片段的自然场景中的手写文字检测方法,有效解决了密集文本行的粘连问题,提高了对任意角度文本行检测的鲁棒性。为了使得基于文字片段的方法可以应用到自然场景中的手写文字检测问题上,我们针对手写文字的特性做了两个针对性的改进来解决其中的文本行粘连问题。首先,我们探究了文字边界区域标签定义的作用,将手写文字的标注框进一步收缩得到文字核心区域,通过对文字边界区域的抑制来降低相邻文本行中间出现文字的响应。第二,提出一个基于图的文本行分割算法,进一步分割错误聚集的文本行。经过以上两个改进,我们提出的基于文字片段的文字检测方法在自然场景中的手写文字检测任务上取得优异的性能。(3)提出了文本行基线片段的概念并基于此将历史文档中的文本行基线检测任务转化为了文本行基线框的检测任务。我们首先分析了现有基于深度学习的方法的不足,即错误断行问题和错误聚行问题。为了解决这些问题,我们提出了文本行基线片段框的概念,从而可以利用更丰富的上下文信息来提高候选文字基线点聚集成行步骤的准确性和鲁棒性。具体来说,我们采用一种基于关系网络的框架来检测文本行基线片段框并预测文本行基线片段框对之间的连接关系,通过这两者直接得到最终的文本行基线。我们的方法可以有效解决错误断行和错误聚行的问题,并在两个基准任务cBAD 2017和cBAD 2019上都取得了最好的性能。
其他文献
本论文主要研究了向量丛的稳定性,典则度量结构的存在性及其相关应用。主要由如下四个部分构成:在本文的第一部分,我们回顾总结向量丛与叶状流形的一些预备知识。在本文的第二部分,我们研究非紧黎曼流形上平坦丛的稳定性与典则度量。我们首先引入了向量丛的解析稳定性概念;进而在适当的假设下建立了泊松度量(调和度量)的存在性与解析稳定性之间的等价关系;同时也考虑了唯一性问题。最后我们讨论了半稳定时的结果,得到了 B
二十世纪以来,半导体集成电路技术的发展让人类进入了现代信息社会。但随着芯片工艺制程已经逐渐接近原子量级,量子力学效应将不可忽略,摩尔定律将逐渐失效。与此同时,量子计算近年来逐渐成为学术界和工业界的热点研究方向。量子计算运用量子力学的基本特性,比如量子叠加态和量子纠缠,来执行计算任务。在某些特定的计算问题上,量子计算将指数倍的快于经典计算。而在众多实现量子计算的物理体系中,超导量子电路体系因其在芯片
黑洞是宇宙中极其重要的天体,在很久之前它就被爱因斯坦广义相对论所预言。作为一个具有量子效应的宏观物体,不论是从经典还是量子的角度来看,确认它的存在都是极为重要的。2019年,事件视界望远镜发表了第一张黑洞的照片。在这张照片中,我们可以清晰地看到一个光环包裹着一块阴影区域。这个阴影区域被称为黑洞阴影,而光环则对应黑洞的吸积盘。研究黑洞阴影和吸积盘对于获取黑洞的信息是很重要的。一方面,我们研究了与黑洞
多通道并行采样是示波器等高速采样系统所广泛使用的技术。时间交织和频率交织是目前被研究及使用较多的并行采样技术。然而,这两种并行采样技术只能提高系统的采样率,无法提高系统的带宽,系统的最大带宽仍然受限子通道的模数转换器(analog-to-digital converter,ADC)带宽。针对这一问题,一系列多级多通道采样系统结构被提了出来。这些系统通过在子通道ADC前端加入采样保持器或混频器,将输
文中对园林施工新技术在园林工程中的实践进行探讨,将部分新技术应用于园林工程施工之中,发挥新技术的应用优势,提升各工序的施工水平,获取了良好施工成果。在此过程中,明确园林施工新技术的原则,根据工程实际情况探索施工新技术在园林工程中的实践,并提出几点可行的实践策略。
近几年来,随着社会的高速发展,我国各个领域均实现了全面的改革。在城市现代化的推进下,园林工程受到了社会各界的广泛关注。作为城市发展中的基础工程之一,园林工程的建设质量在一定程度上决定着城市的发展速度以及整个城市的风貌。人们生活水平的不断提升,对于环境有了更高的要求,这也对城市园林工程建设提出了较高的标准和要求。为全面提高园林工程的建设质量,推动城市园林景观的现代化发展,现如今,越来越多的新技术,新
在人类认识自然和改造大自然的漫长而不断的尝试过程中,物质的存在方式和运动形式是科学研究的两个永恒的、基础的又相互交织的主题,后者正如亚里士多德所言“不知运动者不知自然”①。除了广义相对论和黎曼几何外,量子物相中具有数学意义上的拓扑非平庸性的确认是物理学与数学相结合的又一重大成就②。比如,量子霍尔效应、量子反常霍尔效应和量子自旋霍尔效应等,都是对应具有非平凡拓扑结构的布洛赫纤维丛的物质量子态的典型。
蛋白质翻译后修饰几乎参与所有的细胞活动,是增加蛋白质多样性的关键机制,且对蛋白质的结构和功能均具有重要的作用。此外,蛋白质翻译后修饰的异常可能会引起蛋白质功能紊乱,并与癌症等重大疾病密切相关,而参与翻译后修饰的多种调节酶已成为值得关注的潜在药物靶点。因此深入了解蛋白质翻译后修饰的作用机理,对揭示细胞生命活动规律以及指导疾病的治疗等方面均具有重要的意义。在过去的几十年里,出现了多种鉴定翻译后修饰位点
园林工程是城市绿化的必要手段,为了保证园林建设能够满足人们的需求,必须从根本上提升园林工程质量。随着社会经济的发展和科学技术的进步,大量新技术与新工艺应用于园林建设,促进了园林工程建设的发展。但是从园林工程建设的整体情况来看还存在部分问题,需要在后续的发展中予以补足,以进一步提升园林建设质量。文章主要对当前园林工程中所应用的新技术与新工艺进行分析,并提出应用原则,旨在进一步提升园林建设质量,更好地
在城市化发展背景下,现代城市园林工程建设逐渐引起了人们的关注。园林工程作为城市中的基础建设工作,就要从提升园林设计艺术感、舒适感等方面入手,在满足人们审美需求的基础上引入适合的施工技术,提升园林工程建设施工质量,为我国园林工程稳定发展奠定基础。