基于多维用户特征建模的个性化社交搜索引擎的设计与实现

被引量 : 0次 | 上传用户:zhangersong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,搜索引擎已成为网民获取信息的一个重要途径。然而随着WEB2.0的迅速发展以及各类社交网站的日益崛起,传统搜索引擎的一些缺陷暴露了出来。一方面,各种Web2.0网站和社交网站拥有海量的用户数据,但传统搜索引擎却无法支持对其检索。另一方面,不同的用户因为职业、学历、兴趣偏好及社交关系各不相同,对搜索结果的期待也往往各不相同,因此对搜索引擎的个性化有很迫切需求。鉴于此,本文设计并实现了一个个性化社交搜索引擎,该系统以开放的社交网络为数据来源,通过分析丰富的用户特征及社交关系来改善传统搜索引擎的结果,旨在把对用户最重要、用户最感兴趣的结果排在最重要位置。用户建模是个性化社交搜索的前提和基础,本文根据真实的社交网络新浪微博的数据特征,提出了一种多维度多层次的用户模型,包括用户影响力模型、用户社交关系模型及用户兴趣模型等三个子模型,全面地描述了社交网络中的用户特征。为不干扰用户正常使用社交网络,本文根据新浪微博API特征,设计了隐式的用户数据获取算法,并根据用户模型,设计了一套用户特征生成算法,包括用于计算用户全局影响力的PersonRank特征生成算法、用以计算用户间相似度及亲密度的社交关系特征生成算法及根据朴素贝叶斯文本分类方法建立用户兴趣特征的生成算法,并采用隐式反馈的更新策略和基于用户主动反馈的策略建立了用户模型的更新机制。在用户建模的基础上,本文设计了一套个性化评分和排序机制。评分和排序算法在全文检索引擎Lucene的评分基础之上进行,融合了用户影响力得分、用户社交关系得分及用户兴趣得分来生成最终的文档得分,然后根据得分对文档重新排序。最后,本文在上述研究的基础上设计并实现了一个基于多维用户特征的个性化社交搜索引擎,并开放给数位用户进行评测。根据对点击日志的统计,表明用户对该个性化社交搜索引擎的满意度较全文检索引擎Lucene有较为明显的提升。
其他文献
生鲜产业作为一个能够直接影响到广大民众生活的行业,其发展状况直接影响到广大民众的生活水平,因此,文中在研究学者对冷链物流的特征、流程、存在的问题的研究基础之上,将注
互联网时代的到来给人们的生活带来了许多变化,本文着重讨论"互联网+"给高职会计专业的实训带来怎样的变化,同时也带来的问题探究与分析,并提出针对性的解决方案。
随着我国经济持续快速的发展与城市化水平的提高,城市公共交通作为现代城市客运交通的主体,在城市经济发展中起着举足轻重的作用。公共交通企业要想获得竞争优势,满足公交现代化
20世纪80年代中期,我国声势浩大的民工潮第一次出现,千千万万的农民工来到城市,为城市和国家的建设做出了巨大的贡献,同时也产生了许多问题,引发了社会深层次矛盾。由此看来,农民工
近年来,随着我国经济的发展,居民生活水平的提高,人们对乳制品消费的需求日渐增加。中国乳业的发展开始进入飞速发展时期。然而,2008年爆发的“三聚氰胺事件”对整个乳品行业带来
金属腐蚀是国民经济各个领域中最常见的现象,最有效的解决方法之一是在金属表面涂覆防腐蚀涂层。防腐涂料在使用过程中受到环境因素的影响,其力学性能发生变化而产生微裂纹,微裂
广州,是我国岭南地区的中心城市,不但具有两千多年的历史,而且还是我国最早开放的城市之一,是华南地区政治、经济、文化中心。改革开放以来,广州国民经济稳步增长,上世纪90年代中后
研究目的本课题在充分查阅国内外高级护理实践者及护理学硕士研究生核心能力要求等相关文献的基础上,结合国务院学位办下发的《护理硕士专业学位设置方案》,以能力本位教育理论
分析了我国稻田福寿螺发生为害的趋势,指出福寿螺为害程度上升的原因主要与其生物特性及人为扩散传播、缺少有效天敌控制、农作物种植结构调整和水稻种植方式改变有关。提出采
随着计算机网络和通信技术的迅猛发展,智能建筑得到了越来越广泛的应用,楼宇自控系统作为其特征的一个关键组成部分,也正不断地发展和完善。会展业作为一种新型产业,正随着改革开