快速图像文档分类的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:objzobjz3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本文档分类研究的比较多。而对于图像文档分类一般是利用OCR技术先将其识别成文本文档,再利用文本文档的分类方法进行分类。   本文主要研究脱离OCR技术的图像文档分类技术,以提高系统的运行效率。为了达到这个目的,具体探讨了如何提取汉字图像的特征、如何提取图像文档的特征、如何建立图像文档模型以及采用何种相似度等方面的问题。本文主要采用了笔划密度编码的方法提取汉字图像特征,采用N-Gram模型表示图像文档,在图像文档分类方法上使用了最邻近分类方法,在相似度计算方面采用了传统的余弦度量方法。这种方法使图像文档的分类脱离了OCR技术,因而大大提高了系统的运行效率。尽管分类精度有所降低,但满足了特定场合下的网络图像文档分类的要求。   
其他文献
随着计算机技术的发展,分布式人工智能中多智能体系统(MAS:Multi-agent System)的理论及应用研究已经成为人工智能研究的热点。机器人足球系统为这一领域的研究提供了合适的工
随着社会的快速发展,一些潜在的矛盾冲突也伴随出现,异常声音逐渐引起人们的思索和重视。传统安防迫切要求视频监控引入对异常声音的判别,以提高智能性。长久以来,异常声音的
本文了描述了一种二次生成的嵌入式系统级调试工具SignalTap的工作原理和其特点,它可以在特定的FPGA器件以系统运行的速度观察到内部所有的节点,但是它只能用在特定公司生产
嵌入式技术是工业控制发展的新方向之一,随着Internet 技术飞速发展,网络传送信息具有快速、方便、广泛等诸多特点,结合网络与嵌入式系统的种种优势,将嵌入式系统接入Interne
学位
人类正在进入信息时代,跨入网络化社会,以计算机、通讯和信息技术为支撑的网络日益成为联结整个社会的纽带。这种前所未有的科技革命,已经开始并将继续深刻地影响和改变人们
数字视频压缩编码技术是多媒体通信的关键技术,目前有关视频压缩的国际标准已基本上满足了中高码率的需求,并且进入了实用化阶段,而现有的传输和存储能力对低比特率的窄带通
DNA高通量测序技术的诞生是分子生物学研究的一次技术性的变革,它的低成本,速度快,通量高等特点使它迅速的替代了传统的测序技术。随着测序技术的不断发展,高通量测序技术不断的
本文首先从医学数据的特点出发,阐述了医学数据挖掘的一般步骤、关键技术和智能化方法.本文主要探讨粗糙集理论在医学数据挖掘中的应用,对粗糙集的基本理论以及基于粗糙集的
第三次工业革命以来,随着机器人控制技术的不断更新和网络通信技术的发展,促使一个新的研究热点的产生。就是将机器人控制技术与网络通信技术有效地结合在一起,在机器人原有控制