基于聚类的网络舆情热点发现及分析

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:ch21st
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据对网络舆情分析的需求,构建出基于聚类的网络舆情热点发现及分析系统。通过对样本网页文本的特征提取,构建向量空间模型,使用OPTICS算法获取网页热点簇,根据热点簇特征向量对网页进行二次聚类,从而获取关于舆情的时间演变模式,为相关领域研究提供决策支持。通过二次聚类,提高舆情网页相关度的质量,使网络舆情分析更为准确可靠。
其他文献
《珍妮姑娘》是二十世纪美国最杰出的现实主义作家西奥多.德莱塞的代表作,曾被评论家誉为美国最优秀的小说之一。文章以弗洛伊德精神分析理论为视角,通过对小说中男主人公布
<正>【教学内容】苏教版小学数学六年级下册第76~78页。【教学目标】1.联系百分数的意义认识扇形统计图,能对扇形统计图提供的信息进行简单的分析,提出或解决简单的实际问题,
利用非脑电信号进行睡眠分期是睡眠医学的重要课题。提出一种自动分期算法,利用心率、呼吸率、血氧饱和度和体动信息。首先对前2种信号进行模式描述,形成描述单元;描述单元在
糖尿病是一种由于胰岛功能缺失或减退、胰岛素抵抗等引起的代谢综合征。我国各族人民在长期的生产生活过程积累了丰富的关于糖尿病治疗的传统知识。本研究按照药用植物资源(
采用文献[Luo S L.Using measurement-induced disturbance to characterize correlations as classical or quantum[J].Phys Rev A,2008,77:022301]中提出的测量诱导扰动方
通过透射电镜研究了时效对小变形量2A14铝合金微观组织的影响。结果表明:小变形量的2A14铝合金在150℃时效4 h,合金中基本上没有析出或析出相的含量很少,时效10 h,合金中形成
越来越多的人开始遭遇睡眠问题,评价睡眠质量进而改善睡眠状况已经成为一大课题。准确的睡眠分期是客观评估睡眠质量和诊断睡眠相关疾病的基础,经典自动分期方法基本上是对脑
【正】 陕南汉中褒城石门当褒斜栈道交通之冲,系世界最早通行车辆之穿山隧洞。自汉迄宋,石门内外摩崖刻石多达百余种,其中尤以汉魏颂铭(《石门颂》、《石门铭》) 蜚声中外。
使用4粒子纠缠态作为量子信道,在对4粒子纠缠态的纠缠系数方面并没有做确切要求的前提下,完成了未知3粒子纠缠态的隐形传态.在传输过程中,发送方对2对粒子进行Bell测量并公布