基于改进K-means算法的微博舆情分析研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:wisdom76
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为避免初始聚类中心选取到孤立点容易导致聚类结果陷入局部最优的不足,提出一种基于密度的K-means(聚类算法)初始聚类中心选择方法。该方法首先计算每个数据对象与其它数据对象间的平均相似度,找出平均相似度高于某固定阈值的对象视作核心对象,再从核心对象中选取彼此间最不相似的作为初始聚类中心。通过自构建的新浪微博抓取工具,分别抓取不同类别的数千条数据,经过分词、预处理及权重计算后,用改进的K-means算法对其进行聚类分析,查准/全率较传统的K-means算法要稳定,聚类的平均时间也得到缩短。实验结果表明,改进
其他文献
为了了解公园水体中藻类植物分布概况,探寻旅游开发对水体中藻类植物的影响,本文对山西省榆次玉湖公园藻类植物的种类组成进行了初步研究,经鉴定,共有藻类植物54种,隶属于4门
期刊
高中生物教参中常有一些关于糖蛋白知识的考查,本文初步解释了高中生物教师在教学中遇到的几个关于糖蛋白的常见疑惑。
当今世界,金融危机虽然已经走过了爆发阶段,破坏力已经有所减弱,然而,这场危机所带来的政治、经济、文化领域的影响却在日益地改变着这个世界。在金融危机的大背景下,如何冷
<正>"停连"、"重音"内容是新闻播音员和节目主持人在工作实践中几乎每天都要面临的重点及难点问题。停连指的是"语言的部分之间,层次之间、段落之间、小层次之间、语句之间、
本文从语篇分析的视角 ,通过对英王 Edward VIII辞职演说的剖析 ,强调语篇联结手段对于形成连贯语篇的重要作用 ,指出各种联结手段的合理使用 ,能使语篇更具说服力、感染力。
钟锦的《词学抉微》把词体美感特质作为词学研究的核心对象,以康德哲学作为基准,融会其他哲学之后,确定了一个关于美感研究的基础,认为“士大夫们在小词中迷恋的并不是言志载道不
目的:探讨磷酸肌酸钠联合维生素C治疗小儿病毒性心肌炎的临床效果。方法:2017年2月-2018年12月收治小儿病毒性心肌炎患儿116例,随机分为两组。对照组实施常规治疗,观察组在常
新农村建设中农村社区体育的开展对促进农村经济和精神文明建设具有重要作用。本文采用文献资料法对我国新农村建设过程中农村社区体育工作的开展问题进行了研究。发现在我国
Buck 变换器是一种结构比较简单,应用十分广泛的 DC/DC 降压变换器。由 Buck 电路的平均线性化模型,得到其电压控制下的动态小扰动模型,给出了应用 PI 控制器实现其精确控制