【摘 要】
:
光学字符识别(OCR)时,输出的文本行顺序需与实际的顺序相符.文章在字符Blob分析的基础上,对两个字符Blob外接矩形的相对位置关系进行划分,确定了各位置关系下同一文本行的判断方法,据此对排序后的字符Blob进行文本行初次生成和文本行二次合并,实现了任意方向文本行的生成.实际测试结果验证了所述方法生成任意方向文本行的有效性.
【机 构】
:
南京比邻智能识别技术有限公司,江苏 南京 210000
论文部分内容阅读
光学字符识别(OCR)时,输出的文本行顺序需与实际的顺序相符.文章在字符Blob分析的基础上,对两个字符Blob外接矩形的相对位置关系进行划分,确定了各位置关系下同一文本行的判断方法,据此对排序后的字符Blob进行文本行初次生成和文本行二次合并,实现了任意方向文本行的生成.实际测试结果验证了所述方法生成任意方向文本行的有效性.
其他文献
针对慢性肾病(chronic kidney disease,CKD)致死率高、早期症状不明显的特征,结合互信息和皮尔逊相关系数两种评价准则提出一种慢性肾病预测的多目标特征选择模型.针对慢性肾病预测,提出多目标群集智能特征选择算法MCFS,所提算法在GWO的基础上采用精英反向学习、非线性控制参数和联想记忆策略3个改进算子.仿真结果表明,所提算法对CKD的预测准确率高,筛选出与CKD紧密相关的特征子集能力强,明显优于现有的CKD预测方法和其它特征选择算法,能够为CKD早期患者提供准确可靠的辅助诊断.
为分析1090 MHz信道具体占用情况,提出一种1090 MHz信道分析软件设计与实现方法.该软件采用C++语言编程,将接收机接收到的1090 MHz统计数据帧进行解析处理,利用处理后的数据实时监测信道占用情况;创建本地数据库,将数据进行分类存储和统计;使用MFC制作上位机软件界面,调用后台数据库中存储的数据,对全天的信道占用率做可视化显示,与信道内的各帧信号进行分析比较.测试结果表明,使用该方法设计并实现的1090 MHz信道分析软件系统可以实时处理和统计接收的数据,用人机交互方式监测信道实际使用情况并
针对有标签信号样本数目较少的实际环境中,通信辐射源个体识别技术存在识别准确率较低的问题,提出改进的一致性正则半监督辐射源个体识别方法,在一致性正则方法中引入伪标签思想的改进方案,在3种一致性正则模型上分别加入伪标签正则项.实验中设计适合实采信号数据的Inception深度网络,探究实验参数变化对实验结果的影响,实验结果表明,在通信辐射源个体识别问题上,改进方法比全监督方法、伪标签半监督方法、自编码器特征提取方法和经典的一致性正则半监督方法具有更高的识别准确率.
针对现有肝功能分级方法存在有创性、时效性等问题,提出一种基于CT图像多尺度方向数值模式的肝功能分级方法.利用Gabor滤波器提取肝脏感兴趣区域的多尺度纹理特征,对各尺度的主要方向进行数值模式的紧凑编码并分块统计直方图,获取多尺度特征向量,利用支持向量机构建肝功能分级模型.临床数据实验结果表明,该方法有效且可行,具有非侵入性、高效性和可重复性,为患者肝功能评估提供了基于影像学的辅助诊断.
为解决由于过度的量子噪声使低剂量CT重建图像质量产生退化的问题,提出一种基于分区域处理的联合先验低剂量CT统计迭代重建算法.对重建过程中的图像进行区域划分,对图像进行中值滤波并计算滤波图像的梯度,根据梯度划分出图像的边缘区域和平坦区域,分别利用全变分正则化(TV)和高斯马尔可夫随机场(MRF)正则化对不同的区域进行惩罚,将这两种正则项作为联合先验应用到惩罚加权最小二乘重建算法中,使用超松弛迭代算法(SOR)对目标函数进行求解.仿真结果表明,该算法去噪能力强,能有效保护重建图像的边缘细节信息.
为在全比较(ATAC)问题的分布式计算中达到较高的性能,提出一种基于任务驱动启发式的数据分发策略,充分考虑分布式环境中的存储使用、数据本地性和负载平衡.提出两个分发数据的启发式规则;根据相关约束条件和任务需求,所有的数据项均可在本地进行处理,使对于所有计算任务均具备良好的数据本地性.实验结果表明,对于64个节点的集群,所提策略实现了80% 的存储节约量和100% 的数据本地性,获得了理想化线性加速的89%.所提策略在ATAC问题的分布式计算中达到了较高性能.
针对YOLOv3这一目标检测通用方法在人脸检测任务中实时性低,容易漏检且易受环境影响召回率不高的问题,提出一种基于改进YOLOv3的轻量化网络方法.使用MobileNet网络替代YOLOv3中的特征提取网络,大幅度降低参数和计算量;增加SPP结构,尺度不变的同时降低训练中的过拟合;将Self-attention机制与YOLOv3中的FPN机制相融合,提高人脸检测率与召回率;使用DIoU作为边界框回归损失函数,加速模型收敛.实验结果表明,相较原算法,在公开人脸数据集WIDER FACE上mAP提高了9.0个
为解决自动化仪表检测工作中的作业车间调度问题以提高其工作效率,提出一种基于生命力选择的精英鲸鱼优化算法.利用生命力选择方法替换表现较差的个体,克服鲸鱼优化算法在调节搜索范围方面的不足,避免种群陷入局部最优,加快种群向全局最优解收敛的速度.结合标准实例和北京东方计量测试研究所的自动化仪表检测实例,对算法进行仿真分析,验证了精英鲸鱼优化算法在求解作业车间调度问题的有效性和稳定性,其可以满足自动化仪表检测工作中的日常检测任务调度需求.
针对半直接法SLAM方案的回环闭合问题,提出融合全局描述子和半直接法的双目SLAM方案.全局描述子计算模型结合主成分分析法(PCA)和K近邻方法构建关键帧的全局描述子管理模块;在位姿跟踪模块中使用最小化光度误差的半直接法;结合关键帧全局描述子和半直接法完成闭环检测与全局位姿优化.在公开数据集KITTI和Euroc上进行实验,与ORB-SLAM2、OpenVSLAM进行对比,对比结果表明,该方法在大部分有回环的序列中有更小的绝对轨迹误差,在保证有相似定位精度的同时,提高了算法的跟踪帧率.
随着Web服务数量的迅速增长,服务过载的问题逐步显现.为了解决服务过载的问题,基于服务质量(Quality of Service,QoS)感知的服务推荐成为了服务计算领域的研究热点.从起初的基于协同过滤算法到目前基于深度学习的服务推荐算法,这些算法从各个角度提升着服务推荐的精度.文章以算法的改进过程为主线,对主要的服务推荐算法及其存在的弊端进行了分析与总结,并对未来服务推荐算法的发展进行了展望.