论文部分内容阅读
微博(Micro Blog)作为新型社交媒体积累了各领域的海量数据,对这些数据的分析将会带来很大的社会和商业价值。但由于微博的产品特点使得对其的话题识别方法不同于以往的传统文本。本文针对微博的特点,提出使用LDA模型对微博海量数据中的隐含话题进行建模,解决发散性带来的高维问题。实验结果表明,该方法能够获得较准确的微博话题识别结果。