基于YOLO的自然场景倾斜文本定位方法研究

来源 :计算机工程与应用 | 被引量 : 2次 | 上传用户:leng36318
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提升倾斜文本区域定位的准确度,提出了一种基于YOLO算法改进的YOLO_BOX定位模型。设置不同尺寸的anchor对图片进行训练,且定义LOSS损失函数训练预测模型;使用K-means算法对box进行聚类,并利用NMS方法进行多余候选框过滤;利用Angle Correct算法对聚类后的box进行灰度化处理,通过计算像素灰度值的方差来得到文字的倾斜角度并进行角度矫正。实验结果表明,优化后的YOLO_BOX定位模型在ICDAR2015数据集上,对自然场景中倾斜文本区域的定位中具有较高的准确率和召回率。
其他文献
Two new energetic compounds (AIM)(HTNR) and (AIM)(PA)(AIM=2-azidoimidazole, TNR=2,4,6-trini troresorcinol, PA=picric acid) have been prepared by AIM(2-azidoimid
首先是红外发射器将稳定的红外信号发射出,然后是红外接收器接收,进而红外接收器将红外信号处理,这样来达到对一些电器设备的控制作用。该设计的关键是红外信号的发射和红外
期刊
针对决策信息为Pythagorean犹豫模糊数的多属性群决策问题,提出一种基于Pythagorean犹豫模糊交叉熵的多属性群决策方法。引入Pythagorean犹豫模糊交叉熵的概念。以Pythagorea
近年来, 笔者采用齿线上下瘘管分别切开或挂线、其余瘘管分段遂道式对口引流术治愈复杂性肛瘘78例, 疗效满意, 现将结果报道如下.
期刊
我科临床上对糖尿病肾病、慢性肾功能不全并发严重的顽固性褥疮患者在常规全身及局部治疗的同时,采用中药湿敷治疗Ⅲ度褥疮,收到良好效果,现分析报道如下.
笔者对82例胆囊疾病实施小切口胆囊切除术(MC), 取得良好的效果, 现报道如下.
针对已知地图的室内机器人全局重定位、绑架恢复问题,提出一种基于改进的Netvlad卷积神经网络的室内机器人全局重定位方法,通过激光雷达获取的障碍物信息引导机器人到达空旷
咽异感症是耳鼻咽喉科门诊中经常见到的主诉症状之一, 祖国医学称之为"梅核气", 即"梅核气者, 塞碍于咽喉之间, 咯不出, 咽不下, 如梅核之状也". 在临床上常泛指除疼痛之外的