基于局部特征的维吾尔文印刷体复杂文档图像检索研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:yatou5004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日益趋向数字化的新时代,激增型的电子文档规模极速扩大。因此,有效可控管理文档数据,并快速查找需要的目标文档图像逐渐成为紧迫待解决的问题。国内外诸多文档图像检索领域中的研究者借签图像检索(Image retrieval,IR)中的有效算法,结合文本图像文种与版面自身本质特性实现其快速、精确检索处理。目前,具有鲁棒性的多类局部特征纷纷被应用于图像检索研究中,本文从中受启发,对图文混排的复杂版面结构维吾尔文档图像进行检索研究,使得少数民族文本图像处理研究引入到新型发展趋向。图文混排复杂版面结构的文档图像有别于自然场景、纯文本图像,是一类含有文字、图片、表格及数学表达式的、版面信息丰富的多媒体素材,也是当前大规模文本图像库的主题。本文对于复杂版面文档图像不经过繁琐的版面分割、分析处理,实现高精度检索,弥补维吾尔复杂文本图像检索研究中的空白。本文主要贡献如下:(1)构建具有复杂版面结构的维吾尔文印刷体文档图像样本数据库。(2)提取维吾尔文复杂文档图像的SURF特征,并对其进行改进,有效缩短特征提取耗用时间及降低计算复杂度。(3)对SURF及FAST+SURF特征实现FALNN双向匹配与KD-Tree+BBF匹配,在尺寸、旋转、亮度变换下,对比分析两者的匹配性能,验证局部特征的鲁棒性。(4)对于局部特征实现基于四种距离的相似性度量和基于匹配数目的相似性度量检索方法,并分别在分类、剪切、压缩等调整的数据库中进行检索实验,对比分析两种检索算法性能。(5)为验证两种检索系统稳定性和可靠性,构建维文、阿拉伯文、中文、藏文、自然图像数据库,并对应查询图像进行多种(尺寸、旋转、亮度)变换,分别进行检索对比实验。可知,基于改进SURF特征的检索系统满足用户快速、准确查找目标图像的需求。
其他文献
伴随我国国有市场经济与我国机电一体化的技术的不断发展,我国的电气自动化中的无功补偿技术也得到了广泛发展。所谓的无功补偿技术主要是通过提高电气工作中的电力电压,从而
离子液体指常温时全部由离子组成的液态盐,通常由较大的阳离子和较小的阴离子这两部分组成。因其几乎没有蒸气压、难以燃烧、导电性和酸碱度可调等众多优良特性,逐渐被广泛地
<正>读万卷书,行万里路,是中国传统的求知模式,亦是提升自我修养的途径。从某种意义上说,也是一种生活和治学态度。读书和行路是互补的,书中的知识有限,并且有可能是片面的,
热休克蛋白90(HSP90)是许多癌基因下游蛋白的分子伴侣,参与多重致癌途径,涉及急性髓细胞白血病(AML)的发生和不良预后。HSP90抑制剂是当前AMI.分子靶向治疗研究药物之一,通过抑制HSP9
中国是世界上竹资源最丰富、竹林面积最大、竹产量最高的国家,素有“竹子王国”之称,而安吉又是中国竹子之乡之一。安吉竹产业集群的发展需依靠自主创新作为内在推动力,通过自主
移动互联网时代手机已经进入大学的课堂,MOOC无论在国内还是国外的平台建设火热,但是它也存在着无法实现深度学习和难以融合传统课堂的问题,小规模网络课程SPOC更能够与高校
[目的]探讨PDCA循环在植入静脉输注港病人健康教育中的应用效果。[方法]自2009年11月开始运用PDCA循环于静脉输注港病人的健康教育中,改进目前输液港健康教育中的缺陷。[结果
图像匹配是图像处理技术中的重要研究内容。本文介绍了图像匹配的几个要素,图像匹配算法的分类以及图像匹配性能评价指标,探讨了图像匹配中有待进一步研究和解决的问题。介绍了
行为保全,是指在民事诉讼中,为了避免当事人或者利害关系人的利益受到不应有的损害或进一步的损害,法院有权根据他们的申请,对相关当事人的行为采取强制措施。行为保全能够在法院
期刊
核桃仁榨油后剩余的饼粕中仍含有丰富的蛋白质和膳食纤维,具有较大利用价值。然而,当前国内外对核桃粕的综合利用主要集中在蛋白质方面,关于核桃粕膳食纤维的研究未见报道。