基于精细化工云平台的文本分类算法研究

来源 :信息系统工程 | 被引量 : 0次 | 上传用户:lvchao222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的研究背景为精细化工云平台的建设,其目的就是为了处理现阶段大量关于精细化工领域的文本信息,方便使用者能够及时有效的获取所需要的文本信息,本文主要研究的是基于KNN分类算法的数据挖掘技术,对于实现文本自动分类的过程,主要阶段即为文本预处理过程,它主要的目的是提取文本的特征项,而特征项的选取对于文本自动分类具有重要意义,对于特征项的选取有:信息增益、期望交叉嫡、互信息、统计量等计算方法,本文主要研究那种特征项选取算法最为适合KNN分本分类算法,并通过实验进行验证。
其他文献
对新颁布的2015《普通高等学校图书馆规程》与2002《普通高等学校图书馆规程(修订)》的整体结构框架和各章节条款进行比较研究,才能更好地理解执行新的规程。2005版《规程》对20
本文通过对供应链管理中的风险进行分析,并给出了一些建议,以便提高供应链企业的工作效率。
所谓图形重新组合法就是根据图形结构特点,适当对图形进行剪拼或重新合理组合来解(证)几何题的一种方法.此法常常会得到别致、巧妙的解答,对提高解题能力、发展智力、激发学
内河船型标准化是现代化内河水运体系的重要组成部分,对深化内河优势战略意义斐然。系统梳理内河船型标准化工作历程,分析“十二五”期发展现状与“十三五”期发展形势,厘清内河
图书馆中存储了大量信息,因为传统服务模式的效率低下,针对性低,人们没用充分享受到图书馆便捷,针对这种现象进行研究,引入数据挖掘技术,力图改善图书馆服务模式,推进图书馆个性化服
作为一所地方高校,其教育模式在思想上以及行为规范上更加强调在商科专业的综合素质方面,因为商科专业的主要核心是在于对专业技能方面的技术要求,对商科专业的学生来说最主
现代化的高层建筑在北京、上海和深圳拔地而起,一个又一个的财富神话在不停地上演.投机者在任何一座中国城市购买了商品房后,即便立刻就转手也能获得可观收益。这种看似绵延不绝
德国准分子激光Keracor116型治疗仪成都军区昆明总医院李晶,张良才(650032)在当今眼科治疗曲光的各种方法中,首推PRK术较多地为眼科大夫采用。我院最近引进了一台德国CHIRONTcchnolas生产的Keracor116准分子激光,该机所...
针对天然气管道输送过程中,温井引起的下游局部压力波动影响下游压力检测的准确性问题,使用FLUENT软件模拟实际案例,分析影响程度,结果表明,温井中压力沿着管道中心线会出现
目的:分析目前小包装饮片存在的质量问题。方法:从质量问题的表现、产生原因、预防方法3方面进行讨论。结果:小包装饮片存在的质量问题可以预防与控制。结论:小包装饮片质量提高