Web数据挖掘在个性化搜索技术上的研究

被引量 : 0次 | 上传用户:chchang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网是为用户提供信息交换、共享而发展起来的Internet应用。人们上网的主要目的是查询信息。由于Internet上的信息具有数量庞大、无序性强、重复性大的特点,互联网上的各种信息检索系统----搜索引擎成为帮助人们上网获取信息的主要工具。这些搜索引擎在给人们带来很大便利的同时也暴露出许多问题。搜索引擎返回给用户的检索结果数量越来越大,人们越来越难以找到真正符合自己意图的信息。传统搜索引擎缺乏个性化的局限性日益突出,单单依靠传统搜索引擎己经无法满足人们的需求,因此,搜索引擎的个性化研究成为当今Internet信息检索方面的一个重要课题。本文首先对Web挖掘的理论基础及个性化搜索引擎进行了介绍,其中包括Web数据挖掘分类、Web数据挖掘在个性化搜索中的应用、搜索引擎的分类及检索效果主要性能指标、个性化搜索引擎的基本类型和涉及的主要技术等。其次,针对Google给出的PageRank排序算法的一个缺陷,即同一页面的所有链出页面分得该页面相同权重的PageRank值,研究了给出的具有针对性的新算法,即使得同一页面的链出页面根据自身页面的重要性分得该页面不同权重的PageRank值。再次,本文探讨了用户兴趣模型,包括用户兴趣建模常用方法、用户兴趣模型技术等。最后,设计了个性化搜索引擎模型,思想是将Web挖掘和PageRank技术结合起来,建立用户兴趣模型,引入到个性化搜索引擎中,使检索结果更加符合用户的实际需要。在论文的最后,总结了本文的研究工作与存在的不足,并对进一步的研究工作进行了分析和展望。
其他文献
目的为了了解母婴同室进行母乳喂养的重要性,探讨母婴同室在新生儿护理中遇到的难点及产妇满意的护理对策。方法随机抽样进行临床对照,对840例母婴同室的产妇和新生儿与未进
目的:研究FAK基因过表达对人舌鳞癌细胞株CAL-27凋亡和侵袭能力的影响。方法:构建过表达FAK基因的载体pcDNA3.1(+)-FAK,转染实验细胞。运用qPCR法检测FAK mRNA的表达情况,运
以3,5-二羟基苯甲酸为起始原料,经酯化、苄基保护、水解、酰化、氧化、缩合、还原、脱苄制成硫酸特布他林,总收率21%。
连续挤压技术是一种新型高效加工技术,由于工艺流程短、生产成本低、制品性能优越而在铜加工领域得到日益广泛的应用。中铝昆明铜业有限公司引进的TLJ系列连续挤压铜扁线生产
本文在分析国内外盈余管理概念的基础上 ,根据盈余管理的特征和博弈论的实质 ,提出了盈余管理是其管理主体追求利益最大化的博弈行为的观点。基于这样的认识 ,本文根据博弈论
目的:探讨转化医学在现代医学中的作用、必然趋势及研究前景。方法:查阅并总结大量国内外有关转化医学的最新研究进展。结果:转化医学的实质是理论与实践的结合,要求多学科的交
指出了奥尔夫音乐教育是当今世界三大音乐教育体系之一,奥尔夫音乐(游戏)课程的创造性(即兴性)、综合性、参与性、自然性、民族性和生动活泼的教学方法对培养学生的创新能力
文章通过问卷形式对江苏省8所高校700位大学生进行了调查。通过调查,基本掌握了江苏省高校大学生创业孵化基地所处的现状及存在的问题,对于其以后的发展也有了明确的方向。
为了加快公共基础服务设施的建设步伐以适应经济建设发展的需要,PPP项目融资模式在全世界的应用已成为一种趋势。然而,PPP项目潜在的风险因素复杂多样,因此,应对PPP项目潜在
本文通过分析针对会计事项的会计制度配置格局,探讨了会计制度存在的公共领域,并试图从会计制度公共领域嵌入会计职业道德机制,厘清约束会计行为的会计制度机制和会计职业道