论文部分内容阅读
针对网络社区传统热点话题选择方法中存在的不足,如简单数字统计、没有考虑主题内容等,提出了一种基于社区主题内容的高影响力主题提取方法.运用传统的词语权重计算方法TF-IDF并结合网络社区的特点来定义词语权重,再根据网络社区信息传递的特点得到词语的影响力并计算出词语间的关联度,然后深度挖掘潜在关键词并最终构造出由若干个完全图组成的无向图G,从而得出高影响力主题类型.该方法能够准确提取出当前社区的热点主题并能够在一定程度上对近期热点信息进行预测和判断.