非结构化文本的自动分类检索平台的研究与实现

来源 :软件 | 被引量 : 0次 | 上传用户:looksky1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息科技技术的快速发展给我们的日常生活带来了诸多便利同时各个领域的相关数据文件也在不断增多。在越来越多的信息数据堆积的情况下,为了能够更快速地获取自己想要的信息就必须对文本信息进行分类,文本分类可以有效地查询到数据信息的同时还可以对现有的数据进行自动化管理和分类,这样既方便了数据存储也方便了数据查询。本文的主要研究内容为在利用Lucene实现对POI处理过后的中文文本进行全文检索的基础上,研究现阶段的一些主流的机器学习分类算法,利用Weka对中文文本进行自动分类,以提高平台的查询效率,设计实现一个针对中文文本的自动分类检索平台,具有较强的实现价值。
其他文献
<正> 1984年冬季,沈阳市传染病院组织中西医协作组,在1983年冬运用《伤寒论》法辨治流行性出血热的基础上,继续深入研究。运用《伤寒论》理法方药与现代医学相结合,探索病机,
为了解决城市雨水洪涝灾害与水资源短缺问题,借鉴国外提出的LID、SUDS等研究,我国提出了海绵城市等相关理论。本研究在综合分析国内外相关案例基础上,总结提出了"划分集水区
目的观察米诺环素与阿奇霉素联用治疗儿童支原体肺炎的临床效果。方法选择120例支原体肺炎儿童作为观察对象,随机将患儿分为对照组及观察组,各60例。对照组患儿予以阿奇霉素注
<正> 1.前言 二十世纪是新兴科学迭出的年代。在新兴科学中,生物材料是最引人注目的新星之一,其重要性不仅因为它与人类的自身密切相关,还因为它跨越了材料、医学、物理、生
<正>2005年2月至2010年6月间,笔者采用中药活血生精煎治疗精索静脉曲张性男性不育症69例,疗效满意,现报告如下:1临床资料1.1一般资料所选138例均来自我院男科门诊
从上世纪末开始,中国电视业广泛引进海外节目模式进行本土化生产,这在带来我国电视节目市场繁荣的同时,也催生出诸多急功近利、扰乱媒体生态、跟风制作的现象。本文从“异化
目的:探讨尼卡地平伍用艾络在鼻内镜术中控制性降压的应用及对血流动力学的影响.方法:选择择期行鼻内镜手术的患者ASIⅠ级~Ⅱ级60 例,随机分为尼卡地平组(N组,n=30)和硝酸甘油
<正>面对"国画作为国家形象的艺术表率"这个题目,我颇有些踌躇。在今日,国画是个什么概念呢?按理说以"中国"命名的画种,就清楚地表明是一个与西方完全不同的艺术体系。是与所
为了提高激光诱导击穿光谱的信噪比,从理论上讨论了激光诱导击穿光谱信号与延迟时间之间的关系.利用激光诱导击穿光谱仪对GBW07716合成灰岩标准样品进行了测试,并分析了Ni I
<正>日本自明治维新以来,崇尚西方已成为一种历史的潮流,反映在美术领域也同样如此。伴随着世界步入后现代社会,根植于现代工业化社会的西方现代主义的艺术虽然在日本还有相