论文部分内容阅读
如今互联网上资源的丰富和人们对互联网的依赖,使得人们在浏览网络资源的同时想的更多的是如何能快速、准确地从互联网上获取对自己有用的信息。搜索引擎系统就成为了最受欢迎的获取网络资源的工具。然而,人们在体验搜索引擎系统带来方便时,也体会到了要获取准确、有用的网络资源所带来的困难。目前的搜索引擎主要的思路是将查询关键词与互联网上的资源进行匹配,再返回检索结果。但查询的关键词含有多种语义,从而使得检索的结果存在着主题漂移的现象。而且用户需要在检索结果中进行不断的筛选,以此来寻找有用的资料,这使得用户需要耗费大量的时间在检索结果上。为了解决以上问题,本文提出了一种基于模糊聚类算法的搜索引擎结果排序新方法,即IPCM算法。为了优化检索结果的排序,本文将传统的推荐技术进行了融合,形成了融合推荐算法。并将IPCM算法和融合推荐算法相结合,应用到搜索引擎结果排序中。并通过实验验证了算法的可行性和优越性。本文有以下三个创新点:(1)提出了一种改进的PCM算法,即IPCM算法。本文为了克服了PCM算法对初始值敏感的问题,将用户的兴趣爱好模型作为IPCM算法的初始矩阵。以用户兴趣爱好为模型的初始矩阵符合用户检索的习惯,使IPCM算法在更新聚类中心和更新分类矩阵收敛之后所得到的结果更符合用户所查询的主题,防止了主题漂移。(2)将传统推荐技术进行融合形成了一种融合推荐算法。对于传统推荐的技术,采取取长补短的方法,对基于用户协同过滤推荐技术、基于内容的推荐技术这两种技术进行融合,并将融合推荐算法运用到搜索引擎中。该融合推荐算法对搜索引擎结果排序有较好的优化能力。而且,当使用IPCM算法出现错误时,融合推荐算法在一定程度上对搜索引擎结果排序进行了弥补。(3)提出了一种基于模糊聚类算法及融合推荐算法的搜索引擎结果排序新方法。该算法是将IPCM算法和融合推荐算法进行结合后,应用到搜索引擎结果排序中。算法避免了检索主题的漂移问题,提高了搜索引擎检索的效率。