论文部分内容阅读
事件追踪技术能够将网络中分散在不同地方和不同时间段内的与某一事件相关的信息有效地组织起来,帮助人们全面掌握该事件的发展始末。但是在事件追踪过程中,由于构造初始事件模板的相关报道很少,并且报道事件的文档内容具有动态演变的特点,因此导致事件模板不够准确。本文主要针对事件追踪中存在的问题作出改进,提出一种结合时间信息的事件动态追踪模型。该模型将时间因素加入到传统向量模型中,在此基础上得到文档与事件包含的相同特征词之间的时间相似度,并将其应用于文档与事件的相关性计算。若文档与事件相关,则把文档中新的特征词加入到事件特征词集并重新调整事件特征词集中特征词的权重和时间信息。实验采用了检测错误权衡(DET)曲线进行评估,结果显示与传统的向量模型相比,用于事件追踪的动态模型有效地提高了系统性能,其最小的归一化追踪损耗代价降低了约9%。