基于知网语义相似度计算的特征降维方法研究

来源 :科学技术与工程 | 被引量 : 21次 | 上传用户:bravehearterdoctor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对文本分类处理中的高维度问题,结合知网语义词典,提出了一种新的特征降维处理方法。通过计算特征词汇之间的语义相似度,将原有特征集分成若干特征词集;同一词集内的特征词语义彼此间相似;而不同词集的特征词彼此间相似度比较小。将同一特征词集内的词汇权重相加,从而突出同义词以及近义词对文本分类的贡献,并可以大大降低文本比较的特征维数。实验结果表明,利用该方法在文本分类中得到了较好的分类准确率和分类性能。
其他文献
【关键词】 高效课堂;课外辅导;作用;强化延伸;学生  【中图分类号】 G424.21 【文献标识码】 A  【文章编号】 1004—0463(2015) 02—0082—01   课外辅导是指根据学校课程计划,由学校组织的,教师义务的、无偿的在课余时间针对不同层次学生学习上存在的问题有计划地开辟“第二课堂”,延伸“第一课堂”时间、空间、容量的教学活动,它是打造高效课堂的重要一环。国内外课外辅导
令v与λ为正整数,K为正整数集。一个(v,K,λ)-Mendelsohn设计(简写为(v,K,λ)-MD)是一个对子(X,B),其中,X是一个v元集合(称之为点集),B是由X中k-子集(称之为区组)所组成的集合,其中k∈K且所含元素是
【关键词】 初中化学;实效性;情境;精讲;精练;参与  【中图分类号】 G633.8 【文献标识码】 A  【文章编号】 1004—0463(2016)17—0116—01  课堂是学生获得知识与技能的主要阵地,教师要在四十分钟内向学生传授化学基础知识和基本技能,让他们能轻松愉悦地学习知识,并内化为自己的知识,这是不容易达到的目标。加之初中化学只在初三一年开设,学习时间短,课堂容量大,又有升学的压
在系统分析钢铁市场及钢铁企业特点的基础上,提出了钢铁企业及其上下游中、小企业应建立以钢铁大企业为核心,众多小企业为其配套外包式企业的卫星平台型企业集群模式。结合企业
智能性是Agent突出的特点之一,应用Agent的思想,探讨了如何在网上协作学习中应用Agent技术,建立学生模型和教师模型.构建智能化协作学习模式,从而实现智能化学习,实现了个别化教学