基于YOLOv3与MSER的自然场景中文文本检测研究与实现

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:szm2009szm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对在复杂的自然场景中中文本倾斜、模糊、光照等检测难题,提出一种基于卷积神经网络YOLOv3与最大极值稳定区域MSER的检测方法YOLOv3-M,并针对中文场景分别改善YOLOv3与MSER。通过YOLOv3算法对图像文本区域的矩形坐标进行回归预测,设计一个基于MSER的角度检测方法与之关联,实现倾斜文本行的检测。YOLOv3-M弥补了YOLOv3不能检测倾斜目标的缺点以及MSER检测容易被复杂场景干扰的缺点,并且YOLOv3与MSER都在检测速度上有着优秀的表现。实验结果表明,YOLOv3-M算法
其他文献
绝大多数图计算应用都可以映射为稀疏矩阵和向量运算,稀疏向量的比较运算是稀疏矩阵向量运算的计算瓶颈,为解决图计算加速器中稀疏矩阵列向量比较问题,设计一种稀疏向量比较运算电路,主要包括64个比较运算电路和一个共享存储单元。基于Verilog HDL语言完成电路设计,以SNAP(Stanford Network Analysis Project)上的Flickr数据集为例,在ModelSim SE-64
在子图匹配过程中,随着图规模不断增长,匹配时间呈现指数爆炸的趋势。对此,提出一种基于图连通支配集的子图匹配优化算法VF-SMDS。根据贪心算法构建查询图的最小连通支配子图;通过代价模型计算最小连通支配子图节点的匹配代价,构建最优k查询节点匹配序列;通过支配节点的结构特征缩小查询节点搜索空间范围,在数据图中遍历到满足要求的节点,得到最终答案集。实验将VF-SMDS与GADDI、SPath、VF2++
针对基于定变拓扑网络的具有外部干扰的混合阶多智能体系统的有限时间一致性问题,设计一个分布式有限时间控制律。将原始系统转换为一个等效系统,即一阶和二阶子系统的混合系统,保证了所有智能体达到有限时间一致性的条件。通过两个仿真实例验证了该理论及方法。
调制信号的识别在军用的电子战和民用的智能化无线通信中占有重要的地位,针对现有识别方法识别种类少、整体识别率不高和需要预处理等缺点,设计一个CLDNN端到端深度神经网络。该网络无需人工干预或数据统计,自动提取特征并进行多类调制信号类型识别。实验结果表明,该方法能够同时识别11种信号的调制方式,在低信噪比下识别效率相比现有方法有所提升,当信噪比在-4 dB以上时,整体识别精度达到94%以上。
从DAG(有向无环图)的特殊结构出发,采用POS-PBFT作为主链共识算法,将链式共识算法与DAG结合起来,提出一种区块链新模型SDAG。该模型不仅使得系统的扩展性更高,而且使得交易数据的一致性和时序性优于链式结构。实验结果表明SDAG具有较高的实用性。
球面全景视频映射为矩形视频后才能使用现有编码标准进行编码。针对映射过程中存在内容变形和数据冗余的问题,提出一种最小变形双极方形映射(Minimize Deformation Bipolar Square Projection, MDBSP)算法。算法分三步:将球面按纬度展开成一个等面积的、边界与纬度呈余弦关系的平面图形;用两个三角形和一个矩形组成的多边形近似该平面图形,并使变形度最小;将多边形内像
为解决在实际地质储层特性分析过程中存在测井数据不完整的问题,提出一种基于多网络融合的缺失测井数据复原模型。该模型由两个网络组成,其中通过交叉网络捕获有限度的有效特征之间的相互作用关系,并通过残差思想构造网络模型,降低模型复杂度。另一网络先通过构造的树模型进行特征选择,将树模型得到的稀疏向量通过嵌入层转成稠密向量作为神经网络的输入,从而获得高度非线性的组合特征。通过组合两个网络的输出对缺失测井数据进
为了精准检测输电线路周围的鸟类数目,及时驱鸟以确保线路的正常运行,对YOLO V3算法提出两点改进:将原网络中52×52尺度的特征图进行2倍上采样后与第二个残差块拼接,建立特征融合的检测层,提高算法对小目标的检测精确率;通过计算检测框对应的比例因子更新检测框的置信分数,对非极大值抑制算法NMS进行优化,提升模型对遮挡鸟类的检测能力。实验结果表明该模型精确率可达88.36%,可以有效地检测输电线路周
单目视觉SLAM算法容易受场景纹理影响出现初始化失败或者相机轨迹漂移的问题。为此,提出一种基于改进ORB特征的单目视觉SLAM算法。对输入视频帧构建高斯金字塔提取FAST特征,综合考虑特征点的灰度信息与其邻域的梯度信息生成描述子,并采用多网格策略划分特征点邻域,凭借改进的特征点降低运动模型算法的迭代次数,达到较好的时间效率。实验表明,该算法的相机轨迹精度与特征匹配精度相较于ORB-SLAM得到有效
针对模糊目标检测,提出一个基于生成对抗网络去模糊网络模块(Deblur)与YOLO(You Only Look Once)实时检测算法的检测网络(BL-YOLOv3)。该网络采用生成对抗网络的盲目运动去模糊图像(DeblurGAN)增强的方法对图像进行预处理,保留图像中超高质量的纹理信息并生成接近于真实场景的清晰图像。同时对YOLOv3网络进行裁剪压缩,优化对模糊目标的检测。实验结果表明,该方法有