基于深度学习的自然场景中维吾尔文检测

来源 :新疆大学 | 被引量 : 0次 | 上传用户:hzxj1817
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字作为人类高层语义信息中最直接的表示形式,场景图片中的文本在图像理解中扮演着不可或缺的重要角色,并且有着广泛的现实应用。例如,在无人机巡航、视觉障碍辅助系统、自动驾驶和网络内容监控净化等方面都有着广泛的应用前景,因此场景文本识别一直备受关注。但由于场景图片背景复杂、光照不均匀、光照对比度低、文本多样性以及拍照时所造成的图像文本透视变形等因素使得成熟的光学字符识别技术并不适用于自然场景文字识别。因此场景文字识别已经成为计算机视觉领域中一个重要的研究方向,但现有技术方法中大多数是面向中英文识别的,维吾尔文识别研究却少之又少。自然场景中文本检测是自然场景文字识别的前期环节,其目的是判断不同场景图像(警示牌、街道标志等)是否存在文本,若存在则定位文本所在位置。由于缺乏开放且标注好的自然场景中的维吾尔文样本集直接影响了场景维吾尔文检测与识别工作的高效快速开展。本文针对这一问题,探究并借鉴了深度学习和图像分割的方法生成了人工的维吾尔文图像样本数据集。实验结果表明所采用的深度学习和图像分割方法有效,且生成的人工维吾尔文样本数据非常真实即文字能够自然地融合到自然场景图片中,高效快速地为自然场景中维吾尔文检测提供非人工标注数据。同时针对维吾尔文字符独有的特性,本文改进了单深层神经网络结构用于提取自然场景维吾尔文的多层级和多尺度特征,依据自然场景中的维吾尔文文本行的特征,设计了多尺度规格、多长宽比的默认框以适应自然场景中的维吾尔文检测的需要。改进的单深层神经网络,由维吾尔文特征提取组件和多特征融合文本检测组件组成,以端到端的方式训练学习预测维吾尔文文本框的位置以及文本置信度。经自然场景维吾尔文检测实验表明,改进的单深层神经网络方法考虑了图像的多尺度和多层级征对检测精度的影响,算法的准确率和F值分别为0.7234和0.6115,提高了检测的准确率。
其他文献
健身是人类在生活中根据自身的实际需要和对生活的更高层次的追求,通过自己的身体锻炼来改善促进自身的身体和心理健康发展的一种社会实践活动,它以运动为主要手段,通过自身
<正>"沃易购"平台是中国联通适应互联网经济发展,探索管理模式转型、经营模式创新而建设的通信行业全国性电子商务平台。2014年6月,河北联通"沃易购"平台正式上线,实践证明,
教师专业发展是《国家中长期教育改革和发展规划纲要》的核心内容之一,它强调教师要终身学习,适应教育发展的需要。“中小学教师国家级培训计划”作为提高中小学教师特别是农
此次对中等职业学校工科专业校本课程开发的研究,笔者希望通过对研究的背景、意义以及现状的分析,得出校本课程研究的迫切感与必要性在为学生的专业发展服务、生活服务和可持
目的腰椎间盘突出症(LDH)俗称“腰突症”是由于腰椎间盘变性,纤维环部分或是全部破裂,髓核膨出或突出,压迫脊神经和马尾神经,而出现的以腰腿放射性疼痛、下肢等部位感觉障碍为主要
本文通过对阿城小说中知青身份叙事分析,呈现出知青作家的知青身份逐渐隐退的过程,这个过程正是作家的身心逐渐融入农村生活的过程,是那些世代挣扎在土地上的人们的主体形象
2002年汽车进入家庭以来,全国广义汽车保有量为2000万辆,经过11年,平均每年2位数的增长速度,截至到2013年底,突破1亿大关(包括三轮汽车和低速货车11450000辆)。与此同时,豪华
<正>推广管理会计需要有管理会计人才的支撑。学校是培养管理人才的重要阵地,我国目前已经培养出了一批熟悉管理会计的人才,他们已经成为各单位推行管理会计的中坚力量。新时
国家"丝绸之路经济带"战略构想的提出,为甘肃对外开放带来了前所未有的机遇和挑战。本文在阐述甘肃处于"丝绸之路经济带"建设"黄金段"缘由的基础上,提出利用地理区位、交通便
随着中国高等教育从计划体制向市场体制,从精英教育阶段向大众化教育阶段转型及深入发展,大学为了在教育市场争夺生源,采取了各种策略和措施,日益重视提升大学形象和竞争力。