基于数据挖掘中文书目自动分类算法

来源 :计算机测量与控制 | 被引量 : 0次 | 上传用户:quchaolove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种改进的数据挖掘算法;首先采用ICTCLAS系统进行文本预处理,以词频特征构建词条向量;然后融合词频特征和词频-逆向文件频率特征,构建训练样本集的特征矩阵;接着对该矩阵进行奇异值分解变换,得到语义空间,用于对文本特征向量进行语义空间变换,得到语义向量;最后构建联合支持向量机分类器,实现中文书目所对应的语义向量的自动分类;最后做了大量的仿真实验,实验结果表明,文章方法的分类准确率高于现有方法。
其他文献
通过文献调研及问卷调查分析 ,研究了我国 2 0 1 0年群众体育发展趋势 ,并提出相应建议。
根据国内有关统计数据,对火电厂污染物的排放进行了计算和分析,根据燃煤煤质特点和排放情况,对各种污染物提出了不同的治理措施和综合利用的方法(包括烟尘、硫化物、氮氧化物
海洋天然产物ent-chromazonarol分离于海绵Disidea pallescens,具有抗癌、抗肿瘤活性,是潜在的药物先导化合物。本论文以海洋天然产物ent-chromazonarol等为研究对象,基于合
近年来,城市化迅速发展过程中对城市空间规模扩大的客观需求,房地产市场近年来的限购政策,以及当前居民消费形态升级,都需要一种混合化、多样化的商业服务形式,这些因素有力
<正>北五味子具有益气敛肺,滋肾涩精,生津止渴,止泻敛汗之功效[1]。北五味子叶味甘,微苦,微涩,性平。据于俊林[2]等人分析,每100 g嫩叶含水分79 g,蛋白质3.9 g,脂肪0.3 g,碳
至于中国车未来成长动力。似乎不需要担心,尽管存在诸多不确定性因素。但依照“爱我中国车”之于自主品牌判断,中国车已进入“花样年华”好时光,接下来是勇敢者之间的较量,请锁定