快速图像文档分类的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户：objzobjz3

【摘要】

：

文本文档分类研究的比较多。而对于图像文档分类一般是利用OCR技术先将其识别成文本文档，再利用文本文档的分类方法进行分类。　　本文主要研究脱离OCR技术的图像文档分类技术

【作者】

：

王谦

【机构】

：

北京邮电大学

【出处】

：

北京邮电大学

【发表日期】

：

2005年期

【关键词】

：

图像文档分类快速图像文档笔划密度编码图像文档模型相似度计算特征提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本文档分类研究的比较多。而对于图像文档分类一般是利用OCR技术先将其识别成文本文档，再利用文本文档的分类方法进行分类。　　本文主要研究脱离OCR技术的图像文档分类技术，以提高系统的运行效率。为了达到这个目的，具体探讨了如何提取汉字图像的特征、如何提取图像文档的特征、如何建立图像文档模型以及采用何种相似度等方面的问题。本文主要采用了笔划密度编码的方法提取汉字图像特征，采用N-Gram模型表示图像文档，在图像文档分类方法上使用了最邻近分类方法，在相似度计算方面采用了传统的余弦度量方法。这种方法使图像文档的分类脱离了OCR技术，因而大大提高了系统的运行效率。尽管分类精度有所降低，但满足了特定场合下的网络图像文档分类的要求。　　

其他文献

RoboCup小型组（F-180）足球机器人的运动控制和路径规划

随着计算机技术的发展，分布式人工智能中多智能体系统(MAS：Multi-agent System)的理论及应用研究已经成为人工智能研究的热点。机器人足球系统为这一领域的研究提供了合适的工

学位

机器人足球比赛多智能体系统路径规划运动控制

基于MFCC的异常声音识别技术研究

随着社会的快速发展,一些潜在的矛盾冲突也伴随出现,异常声音逐渐引起人们的思索和重视。传统安防迫切要求视频监控引入对异常声音的判别,以提高智能性。长久以来,异常声音的

学位

异常声音Mel频率倒谱系数特征提取小波变换分类识别

基于FPGA的逻辑分析技术

本文了描述了一种二次生成的嵌入式系统级调试工具SignalTap的工作原理和其特点,它可以在特定的FPGA器件以系统运行的速度观察到内部所有的节点,但是它只能用在特定公司生产

学位

FPGA大规模集成电路示波器数字系统逻辑分析仪嵌入式系统

非对称网络结构的嵌入式通用控制节点

嵌入式技术是工业控制发展的新方向之一,随着Internet 技术飞速发展,网络传送信息具有快速、方便、广泛等诸多特点,结合网络与嵌入式系统的种种优势,将嵌入式系统接入Interne

学位

嵌入式系统以太网RCM2200TCP/IP 协议

基于高阶滤波器的并网变换器关键技术研究

学位

基于多层局域网的农业信息系统的研究和控制

人类正在进入信息时代,跨入网络化社会,以计算机、通讯和信息技术为支撑的网络日益成为联结整个社会的纽带。这种前所未有的科技革命,已经开始并将继续深刻地影响和改变人们

学位

农业信息网信息控制局域网精准农业

低比特率视频压缩算法的研究

数字视频压缩编码技术是多媒体通信的关键技术,目前有关视频压缩的国际标准已基本上满足了中高码率的需求,并且进入了实用化阶段,而现有的传输和存储能力对低比特率的窄带通

学位

视频压缩矢量量化小波变换进化策略镜头分割分形编码

高通量测序数据误差分析方法研究

DNA高通量测序技术的诞生是分子生物学研究的一次技术性的变革，它的低成本，速度快，通量高等特点使它迅速的替代了传统的测序技术。随着测序技术的不断发展，高通量测序技术不断的

学位

高通量测序数据误差DNA序列贝叶斯理论估计重叠性验证

粗糙集理论在医学数据挖掘中的应用

本文首先从医学数据的特点出发,阐述了医学数据挖掘的一般步骤、关键技术和智能化方法.本文主要探讨粗糙集理论在医学数据挖掘中的应用,对粗糙集的基本理论以及基于粗糙集的

学位

粗糙集理论医学数据挖掘知识获取属性约简

移动机器人遥操作系统设计

第三次工业革命以来，随着机器人控制技术的不断更新和网络通信技术的发展，促使一个新的研究热点的产生。就是将机器人控制技术与网络通信技术有效地结合在一起，在机器人原有控制

学位

遥操作机器人网络通信嵌入式系统TCP/IP协议程序设计

快速图像文档分类的研究

其他学术论文