基于概念树的文本自动分类系统的研究与实现

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zxjxz33371
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文分类是信息处理的重要研究方向,现在应用较多的都是基于统计的分类系统,本文介绍了一种新型的文本分类理念,通过概念符号化,使用数字化的概念而非词汇来组成特征项,能最大限度地保留文本信息,且不需要训练语料,能灵活适应不同的分类体系。接下来详细描述了领域特征信息提取的4个步骤,以及分类体系的选取与设计。最后给出了实验的测试数据,并对影响性能的一些关键因素进行了分析,指出了进一步提高分类性能的途径。
其他文献
为推动大学生网络媒介素养教育创新,从探讨协同理论的内涵意蕴入手,通过协同理论的视角分析大学生网络媒介素养教育引入协同理论的必要性和可能性。大学生网络媒介素养教育在
互联互通是个老问题,发生之频繁,已经让人见怪不怪了,如今,当两大运营商握手时,人们似乎看到了希望,但更多的还是疑惑。
2005年10月22日消息,北京市公安局宣布,北京东方微点信息技术有限责任公司为研制生产防御病毒软件,违规操作,擅自从国家明令屏蔽的、危险度极高的国外病毒网站上直接下载大量计算
科学、完善的教学质量评价体系,是提升人才培养质量、促进教师专业发展、增强高校综合实力的重要保障。基于激励理论对教学质量评价的指导作用,针对新建应用型本科院校教学质
有些人常说:“我其实吃得特别少,没办法,喝水都长肉!”$$ 在此澄清:水是没有热量的,因此喝水不会让人长胖。那为什么吃得少还长胖呢?$$ 通过大量随访发现,很多易胖的人只注意到自
报纸
三年磨一剑,方兴东开始为他的博客帝国谋划前程了。
期刊
飞利浦不断剥离IT业务,其追求的目标很明显,转向稳定且利润丰厚的医疗保健等行业,以避免因某些业务的市场波动而影响其整体发展
本文基于粗糙集理论和模糊聚类的方法对图书馆的用户评价数据进行了分析.旨在寻找用户评价指标之间的关联规则,确定用户评价的关键性指标。
搭配是汉语自动句法分析的重要知识源,而动词是句法分析的核心和前提。论文面向中文信息处理.通过对真实文本的统计分析归纳了用于自动获取搭配的规则,研究了动词一动词搭配中各