论文部分内容阅读
随着全球信息化的发展和社交网站的丰富,越来越多的人喜欢在社交网站上分享自己的心情,发布一些动态。微博作为一种新型的既有关注又可以分享信息的社交媒体,它形式多样化、发布便捷、传播快、交互式更强的特点受到了大量用户喜爱。自微博兴起以来,微博的发布数量非常庞大,而如何有效、快速地挖掘出自己所需要的信息非常重要。选择新浪微博为研究对象,通过网络爬虫从新浪微博上获取微博信息,并通过k-means算法对数据进行了分析。