论文部分内容阅读
网络话题充满噪声,用户在浏览网络的过程中,逐步添加关联性高的网页到话题中,并从话题中删除关联性低的网页,从而形成纯净话题,这就是话题优化的过程。基于此,本文提出一种基于异质图随机游走的模型来模拟用户优化话题的过程,异质图模拟网络内容的关联性,而随机游走模拟用户浏览网络的过程。对于一个网络话题,该模型能够计算出所有网页属于该话题的概率,根据概率分布就能够判断真正属于该话题的网页,从而模拟网络话题优化的过程。仿真结果证实,本文提出的模型可以准确、完整的模拟话题的优化。而通过用户对优化结果的主观评价,同样