论文部分内容阅读
本文从多个维度对词进行综合判断,提出了一种基于决策树的潜在爆发词探测思路与方法。首先对词的生命周期及其爆发现象进行了分析,从词的能量演变、词与词簇的关系、词与已爆发词的关系等多个角度归纳了文档流中词爆发的潜在影响因素;然后在对综合决策方法对比分析的基础上,选取决策树作为综合判断模型,并针对决策树判别过程中的关键问题提出相应的解决方案;此外还实现了具体的算法,并分别针对网络新闻和科学文献两种类型的文档流进行分析和实验,验证了方法的效果。