【摘 要】
:
人工智能时代的到来,使人们的生活越来越便利并且幸福指数不断上升。计算机视觉作为人工智能的主要分支,发展速度越来越快,研究逐步趋于深度学习方向。传统光学字符识别已经应用于各种智能设备,比如银行卡号识别、身份证识别等,但是对于外部的因素要求极高:拍摄图像要求内容清晰、在指定候选框内放置身份证头像等。此外,光学字符还应用于信息录入,降低人力资源消耗,提升效率。但是自然场景下的文字主要是广告招牌、指示牌、
论文部分内容阅读
人工智能时代的到来,使人们的生活越来越便利并且幸福指数不断上升。计算机视觉作为人工智能的主要分支,发展速度越来越快,研究逐步趋于深度学习方向。传统光学字符识别已经应用于各种智能设备,比如银行卡号识别、身份证识别等,但是对于外部的因素要求极高:拍摄图像要求内容清晰、在指定候选框内放置身份证头像等。此外,光学字符还应用于信息录入,降低人力资源消耗,提升效率。但是自然场景下的文字主要是广告招牌、指示牌、宣传语等,特点是非固定长度、格式多样化、尺寸多变。场景文字识别由于自身难点,仍处于不断优化的时期。本文通过深度学习技术,研究了自然场景中的文字检测与识别技术,并设计实现了场景文字实时智能检测系统。主要工作内容为:(1)针对YOLOv3模型对较小目标检测不足的问题,对其网络结构、特征尺度进行改进:采用通道减枝的模型减枝方法去除冗余神经元,达到模型轻量化的目的,同时调整模型的特征尺度,提高模型对较小目标的检测精度。(2)通过360万数据集,来训练CRNN端到端识别模型的识别能力,并且通过CTC模型来处理序列的解码问题识别非固定长度的文字序列。(3)基于Web程序设计的基础上实现场景文字实时智能检测系统,实现对场景文字图像的实时检测、识别。首先通过YOLOv3模型检测文字并确定文字位置,然后通过CRNN模型识别文字,达到实时检测识别的目的,最后将识别结果可视化。在公开的数据集和实际生活中的自然场景数据集上对本文提出的YOLOv3+CRNN网络进行了实验。实验证明,本文提出的端到端网络的性能达到了预期效果。自然场景文字检测与识别技术为人工智能其他分支的发展提供了技术支持。比如机器人方向通过场景文字获取信息进行转换;智能辅助方向,如盲人阅读、盲人导航、智能驾驶等应用。所以,提高识别的实时性、精确度有着非常重要的现实意义和价值。
其他文献
伊丽格瑞以弗洛伊德为靶标,通过模仿其理论方法,解构以男性为参数的一元化性别话语体系,重构男/女性生理解剖学,在此基础上提出且确证了多元化的“女性风格”。作为后现代女性主义重要代表,伊丽格瑞理论对性别“禁忌”话语不断越界,将一元结构解构—重构为平等、互补的二元结构,标志着女性主义理论方法论的成熟,但伊丽格瑞始终能够反省自身理论建构的不足,倾六十年之力不断自我完善、深化,甚至于垂暮之年开启跨地域、文化
人际适应是指个体开始进入一个新的环境时,感到自己的认知和行为不能完全融入这个新的环境,而为了满足自己人际交往的需求,创造一个良好的人际关系,选择以积极的心态对自己进行行为上的调节,从而使自己融入新环境的过程。人际适应是个体保持身心健康的重要前提,更是影响大学新生未来全面发展的重要因素。大学一年级是个体从高中到大学的过渡期,该期间学习和生活模式发生急剧变化,面临新的人际环境,很多新生会对新环境感到不
在人工智能、大数据、物联网等新兴技术的驱动之下,翻译技术发展势头强劲,已成为翻译专业本科和硕士教育中的核心课程部分,深刻影响着新文科建设背景下的翻译教育。本文秉承《新文科建设宣言》理念,参照《翻译专业本科教学指南》和《翻译专业学位研究生核心课程指南》,结合语言服务行业发展的新要求和国内外翻译技术的教学实践,从课程定位、设计原则、课程内容、教学方法、课程考核等方面,详细探讨了新文科背景下翻译技术核心
在公立医院发展过程中,基建工程管理已成为十分重要的一项内容,对公立医院的发展方向和速度具有重要影响。针对公立医院基本建设进行分析,其与普通公共项目建造要求不同。公立医院需要在基建工程管理中合理控制人力、物力以及财力,并充分运用全过程造价控制理论,从而在保证基建工程质量的基础上提升工程管理水平,合理控制工程造价,提高工程的经济效益。
目的:分析多节段胸椎后纵韧带骨化症(ossification of the posterior longitudinal ligament, OPLL)术中超声辅助下环形减压术的手术疗效和术后神经功能改善情况。方法:选择2016年1月至2021年1月北京大学第三医院多节段胸椎OPLL患者的病例资料进行回顾性分析,所有病例均完成后壁切除后行术中超声检查确定环形减压节段,并进行环形减压。纳入研究的30
<正>酒尊是两汉时期高等级墓葬中常见随葬器物之一,有些墓葬壁画或画像石、画像砖上还可见其用于庖厨、宴饮等活动的使用情景。即便自名器物中有“温酒樽”,酒尊却仍仅被学术界视为盛酒器。但从传世文献看,酒尊的使用功能不仅局限于盛酒,史籍记载“常满樽”可以边酌边注。出现于画像石、画像砖酿酒制备场面中的酒尊,抑或与制酒有关。北魏学者以“阳燧樽”来注解汉代的流酒器“滑稽”,但“阳燧樽”的实际形制及其与流酒器的联
液晶电视目前在国内市场,市场基本趋于饱和,且被大型企业垄断,而北美、欧洲和非洲地区等国外的市场前景广阔。国外液晶电视订单的特征是差异化需求明显,平均单量小。在这种环境下,国内中小型制造企业采用多品种、小批量、按订单生产的ODM生产模式,符合海外市场需求,销售量快速增长。但是ODM模式下,企业响应时间普遍较长。如何在接下来的竞争中生存并持续发展下去,提高利润增长率,其中缩短响应时间是一个非常重要的环
<正>中国新闻网|2019-05-24 15:02:14中新网北京5月24日电(记者孙自法)致力于推动全球现代化研究的《世界现代化论坛章程》,24日在北京由来自美洲、亚洲、欧洲的3位世界现代化论坛联合主席共同签署,决定把世界现代化论坛总部设在北京,并确定论坛旨在提供一个开放的、非赢利的国际学术平台,以促进全球现代化研究和世界现代化进程。
目的 分析新疆哈密地区500例急性呼吸道感染患儿13种病毒多重检测的调查结果。方法 选取2018年1月-2021年1月入院就诊的急性呼吸道感染患儿500例,采用多重逆转录聚合酶链反应(RT-PCR)技术扩增,通过毛细管电泳,检测13种呼吸道感染病毒:人呼吸道合胞病毒(RSV)、人鼻病毒(hRV)、呼吸道腺病毒(AdV)、甲、乙型流行性感冒病毒(Inf A、Inf B)、副流感病毒(PIV 1/2/