论文部分内容阅读
提出一种发现微博中热点话题的方法:选择最频繁出现的字符串,其长度分别为1、2、3、4、5、6、7、8个字,每种里面出现的最频繁的前50个字符串分别提取出来,总共形成400个字符串,浏览它们就可发现数据集中当前的热点话题。实验表明:可在较短的时间内得到这400个频繁出现的字符串,并从中发现数据集中的热点话题。