论文部分内容阅读
HITS是一种经典的Web链接分析算法,其主要问题是容易发生主题漂移和互相加强。针对这些问题,提出了一种改进的算法T-HITS。通过一种网络结构图来映射垃圾链接集与其对应的网站,并结合链接文本将垃圾链接排除,最后利用可信度模型来修正结果,实验数据表明改进后的算法提高了查询结果的相关度,减少了主题漂移的发生。