主题舆情分析中的语义Web文本分类研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:loop000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是网络主题舆情分析中的关键技术,传统Web文本分类将文本关键词的相似度作为分类依据,丢失许多重要的语义信息,导致分类结果不够准确且计算量大.本文提出一种基于语义相似度的Web文本分类方法,利用特定的领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量,给出Web文本相似度的计算公式并实现基于语义相似度的KNN算法.结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少计算量并提高了分类精确度.
其他文献
目的观察帕罗西汀治疗血管性痴呆伴焦虑抑郁患者的临床效果。方法选择本院收治的65例血管性痴呆伴焦虑抑郁患者作为研究对象,按照随机法分为对照组(33例)与观察组(32例)。对
在考虑了BCS近似的相对论平均场模型的框架内,通过系统研究U同位素费米面附近的单粒子能级、单粒子能级占有概率和BCS近似下的粒子数偏差,首次发现U同位素中的大多数元素均有比
怎样让秋马铃薯在春节前上市获得较为理想的市场价格?怎样让秋马铃薯能获得较为理想的产量?从生产实际出发,通过大量的调查和试验,总结出一套秋马铃薯栽培和贮存技术,具有很
在已有的调谐基片自偏压研究的基础上,进一步研究了基片台空间轴向位置对基片自偏压-调谐电容曲线的影响;研究了基片分支串联电阻对基片自偏压的影响,发现了在电阻值区自偏压自
随着再生水管道使用时间的延长,再生水中的微生物会以管壁为介质附着生长并逐渐形成生物膜,一些会对人体健康产生危害的微生物可能会在生物膜中复生并大量繁殖。此外,研究表
当前对客观知识体系中语义关系组合方面的研究相对较少,且目前都无法为任意两个相邻语义关系的组合提供判断依据。由于现有的客观知识体系中偶然存在着大量的有组合结果的语义
决策属性是情报的本质特征之一,情报研究与服务本身也属于决策支撑的范畴。本文对决策需求的变化进行了分析,强调了为决策提供支撑是情报研究与服务的本质特征,并在此基础上对面
研究分子的形状和大小对于进一步探究分子的物理化学性质起着重要作用.使用MELD精密从头计算中的CISD方法,采用6-31+G(d,p)基组,结合自编的程序,计算并研究金属氢化物(MH)n(M=Li,Na