基于模糊聚类算法及推荐技术的搜索引擎结果排序

被引量 : 0次 | 上传用户:shenyang0623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今互联网上资源的丰富和人们对互联网的依赖,使得人们在浏览网络资源的同时想的更多的是如何能快速、准确地从互联网上获取对自己有用的信息。搜索引擎系统就成为了最受欢迎的获取网络资源的工具。然而,人们在体验搜索引擎系统带来方便时,也体会到了要获取准确、有用的网络资源所带来的困难。目前的搜索引擎主要的思路是将查询关键词与互联网上的资源进行匹配,再返回检索结果。但查询的关键词含有多种语义,从而使得检索的结果存在着主题漂移的现象。而且用户需要在检索结果中进行不断的筛选,以此来寻找有用的资料,这使得用户需要耗费大量的时间在检索结果上。为了解决以上问题,本文提出了一种基于模糊聚类算法的搜索引擎结果排序新方法,即IPCM算法。为了优化检索结果的排序,本文将传统的推荐技术进行了融合,形成了融合推荐算法。并将IPCM算法和融合推荐算法相结合,应用到搜索引擎结果排序中。并通过实验验证了算法的可行性和优越性。本文有以下三个创新点:(1)提出了一种改进的PCM算法,即IPCM算法。本文为了克服了PCM算法对初始值敏感的问题,将用户的兴趣爱好模型作为IPCM算法的初始矩阵。以用户兴趣爱好为模型的初始矩阵符合用户检索的习惯,使IPCM算法在更新聚类中心和更新分类矩阵收敛之后所得到的结果更符合用户所查询的主题,防止了主题漂移。(2)将传统推荐技术进行融合形成了一种融合推荐算法。对于传统推荐的技术,采取取长补短的方法,对基于用户协同过滤推荐技术、基于内容的推荐技术这两种技术进行融合,并将融合推荐算法运用到搜索引擎中。该融合推荐算法对搜索引擎结果排序有较好的优化能力。而且,当使用IPCM算法出现错误时,融合推荐算法在一定程度上对搜索引擎结果排序进行了弥补。(3)提出了一种基于模糊聚类算法及融合推荐算法的搜索引擎结果排序新方法。该算法是将IPCM算法和融合推荐算法进行结合后,应用到搜索引擎结果排序中。算法避免了检索主题的漂移问题,提高了搜索引擎检索的效率。
其他文献
随着我国出入境边防检查法律体系的日益完善,出入境边防检查行政赔偿制度也将会更加规范化。这就要求我们出入境边防检查机关及其工作人员一方面在行使检查职权时,必须严格依法
伴随经济全球化的发展,企业参与国内国际竞争面临越来越多的挑战。企业核心竞争力优势已不再局限于单一的产品、技术、人才等要素,也不再局限于战略、市场、组织管理等优势,企业
在社会经济不断发展的前提下,商标价值越来越重要。但是,有关注册商标的权利限制问题的研究还处于雏形阶段。注册商标的权利限制所包含的类型有不少几种,不过,合理使用、在先使用
在新课改、学校本位课程发展、使其成为对国家课程、地方课程的有益补充,是代表教育改革的大趋势。本研究针对我国中小学书法教育的现状,即缺少行之有效的教材、教学模式陈旧、
  目的:采用文献资料、实验等研究方法从理论和实践上对男子水球项目关键体能要素及训练监控方法进行研究。方法:(1)选取湖南省男子水球队健将级运动员12人为研究对象。(2)寻
中职语文综合实践活动是我国新一轮中职教育语文课程改革大力提倡的语文情境活动。它立足于语文学科,以学生语文素养和综合能力的提高为目的,以丰富的学习内容、灵活的学习方式
雷达辐射源信号识别是目标识别技术的重要组成部分,随着现代电子对抗越发激烈,复杂体制的雷达辐射源迅速增加且逐渐占据主导地位,复杂多变的信号形式逐渐使传统的识别方法失去有
从1876年第一部电话诞生至今,通信技术一直处于高速发展当中,作为通信技术的基础以及最重要的组成部分,语音通信在近年来更是得到了巨大的发展,VoIP业务正是新一代通信系统当中语
中专是培养与社会相适应的专业技术人才,是与各行业直接接轨,补充各行业的技术职位,培养专业技术人才的主要渠道。中专学校体育课程是被忽略的课程,如何能够提高中专体育的重要性
在我国的司法审判案件当中,民事案件一直占据大部分的比例。而在民事案件中,又以离婚案件、劳动争议案件、交通事故及工伤索赔案件等占据着半壁江山。许多法院为了应对大量的同