论文部分内容阅读
社会化标注是Web2.0环境下的新兴标注方法,标签是其核心要素,但是标签的多样性、模糊性、非结构化以及语义关系不明等特点影响着信息检索的效率。本文以“豆丁医学”为例,利用《中国分类主题词表》的层级结构关系和标签的统计学规律,建立标签和主题词间的映射关系。并通过标签聚类来扩展这种映射,为用户提供更好地标签推荐和层次浏览机制。实验证明,本文提出的基于主题词的标签推荐模型能够较好地为用户提供标签推荐和分类导航服务。