论文部分内容阅读
随着科技发展和网络的普及,人们进入信息爆炸时代,个性化信息服务成为人们研究的热点,而作为个性化服务核心的用户模型质量的好坏直接影响到个性化服务的质量。目前的已有用户兴趣模型,在一定程度上提高了个性化服务的质量,但这些用户建模技术都是通过从用户浏览的文档中提取关键词来获取用户的兴趣特征。这种方法,不但浪费大量时间从文档中提取关键词,而且浏览相同文档的不同用户,对内容的需求角度可能不同,但是系统对不同用户提取同样的关键词,不能突出“个性化”的意义,在一定程度上降低了个性化服务的质量。随着Web技术的发展,标签(Tag)服务被提出后,由于其随意性和简洁性,越来越受到网络用户的喜爱,已经在互联网上广泛应用。由于当前用户建模的缺点和Tag的广泛应用,本文对基于Tag的用户兴趣模型进行研究。首先,验证了Tag中蕴含用户稳定的兴趣并研究了Tag的分布特征;其次,提出加权树形结构由粗到细的粒度表示用户模型,为提高个性化服务时效性,对用户频繁一起使用的Tag建立加权频繁项集表,并且对用户“自创”词汇进行了合理的处理;再次,提出了基于WordNet计算Tag的语义相似度,并使用聚类算法建立用户模型,而且提出了用户模型更新的方法和利用此模型实现个性化服务的流程;最后,选取数据集进行过滤仿真实验,并对实验结果进行分析。该模型避免了从文档中提取关键词的复杂过程,而且使用用户保存Bookmarks时所贴的Tag作为用户的兴趣特征词来表达用户兴趣,从用户的角度表达了用户的兴趣特征。