论文部分内容阅读
[目的/意义]梳理国内外微博文本挖掘的研究现状,展望未来的研究方向。[方法/过程]介绍微博文本挖掘的背景和意义,从微博的数据获取、文本语义挖掘方法及应用研究3个方面,对比微博数据获取的不同方式,分析文本预处理过程和文本处理的若干方法,总结当前微博数据的应用现状。[结果/结论]微博数据获取技术主要有基于API、基于网络爬虫和基于网络数据流3种方式;微博文本挖掘涉及文本分类和聚类、话题检测、情感分析等方法;微博数据在舆情分析、商业营销及社会服务等方面已经得到广泛应用。