论文部分内容阅读
针对藏文现代图书版面中的文本行分布不均匀、现代藏文字体差异较大的问题,提出了一种基于Faster R-CNN的版面文本行检测算法。通过在整理标注的数据集上训练,用ResNet-50网络提取出藏文现代图书版面特征信息。为了有效提高模型的泛化能力,在COCO数据集下的网络模型中进行迁移学习。实验结果表明,该方法可对藏文现代印刷物的版面实现文本行的定位,检测准确率为83%,召回率为95%,明显提高了版面检测的精确度。