中文专利文献自动分类

来源 :嘉应学院学报 | 被引量 : 0次 | 上传用户:suan11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用KNN算法实现了一种中文专利文献自动分类系统。针对专利文献数据规模过大,分类效率低下的问题,采用修剪样本技术删除冗余样本,提高了分类器的效率。为解决修剪样本导致干扰文献积累对KNN分类性能下降的影响,系统使用信息增益对专利文献进行特征词选择,削弱了干扰文献对KNN分类的作用。实验证明,采用修剪样本技术和基于信息增益的特征词选择能有效缩小训练集规模,提高KNN分类准确率。
其他文献
介绍了永久美式幂指期权这一金融产品的数学模型。它的定价问题是一个退化的抛物型变分不等式,也是一个自由边界问题。主要运用ODE方法对它进行理论分析,求出了该问题的显式解
目的:探讨急性哮喘患者T细胞亚群的变化及意义。方法:采用直接免疫荧光法,应用流式细胞仪,检测30例急性发作期哮喘患者及30例健康人群外周血CD3^+T细胞、CD4^+T细胞、CD8^+T细胞的数
曾辉(1956-),男,湖南益阳人。1982年1月毕业于武汉工学院机械系。同年留校任教至2002年12月。在该校工作期间,一直从事材料性能和无损检测方面的教学和科研工作,2001年获工学硕士学
文章阐述了“现代学徒制”模式下高职学生思想政治教育工作面临的挑战,探索了“现代学徒制”模式下高职学生思想政治教育工作的实践,即构建联合育人机制,满足现代学徒制要求;改革
眭平(1960-),江苏镇江人.江西师范大学物理系本科毕业。先后赴南京师范大学、北京师范大学进修学习研究生课程。曾任江西抚州高等师范专科学校物理系副教授、系副主任,嘉应教育学
设计了一种基于CAN总线和语音识别的智能家居控制系统。主要介绍了系统硬件设计,包括语音识别系统、CAN接口设计和基于公共电话网的远程控制接口设计等,并简述了系统的软件设计
原先只知道原甸是新加坡著名诗人,却不知道他是小说写作的高手,这回读了他的三部长篇——《活祭》、《奉献》、《重轭》(下称《探索三部曲》),真是完全出乎意料,没想到他的小说写得
文章以黔南幼专为例,分析了高等专科学校学生自主性的特点,调查结果表明自主性的总体水平和五个方面的自主性发展在年级、专业上不存在显著差异;在性别上除自我控制方面外无
科学就是关于自然系统化的知识。它是推进人类社会进步的重要力量,具有重要的价值意义。怀疑、自由和民主是现代社会的核心理念,一般认为,它们与科学之间仅有外在关联,而没有内在