面向用户兴趣的用户浏览行为分析方法及应用

被引量 : 13次 | 上传用户:BNBNBN668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web上资源的急剧膨胀,面对用户提供的有限查询词,当前的搜索引擎提供的千人一面的搜索已经难以满足用户对搜索结果的需求。在用户使用搜索引擎进行信息检索的过程中,依据用户的实际兴趣为用户返回个性化的搜索结果可以提高用户对搜索结果的满意度。大量研究表明用户的实际兴趣与其在网页上的浏览行为是密切相关的,通过用户浏览行为分析可以获取用户兴趣信息,进而构建用户兴趣模型,使搜索结果更加贴近用户的期望。然而,目前的隐式用户兴趣获取方法无法很好的预测出用户对页面的实际兴趣度。究其原因,一方面是由于当前研究尚未考虑到用户的浏览行为可能随搜索任务类型的不同而变化。另一方面,当前的用户兴趣获取方法多使用某种特定用户行为预测用户兴趣度。针对上述问题,本文探究用户浏览行为在不同类型的搜索任务中所表现出的差异,并研究联合分析多种用户浏览行为的隐式用户兴趣获取方法。在此基础上构建适当用户兴趣模型,最终得出用户的实际兴趣,从而实现个性化服务,使搜索结果更加贴近用户的期望。具体的,本文将任务类型分为导航型、信息型、事务型三种不同类型,将用户的基本浏览行为转换为页面停留时间时间、鼠标点击次数、页面重访问次数以及滑块移动次数四种可分析行为事件。通过Bernard提出的算法完成了任务类型的自动识别,分析了四种可分析行为事件在不同搜索任务类型中表现出的差异。在用户行为分析阶段,本文基于M5模型树对可分析事件建模完成对用户兴趣度的计算,在计算过程中树的剪枝和相关系数平滑是建模过程中必须考虑的问题。模型评价阶段,本文使用模型准确率评价指标将不区分任务类型和区分任务类型的模型与Nicholas Belkin的模型进行了对比。为了清晰有效的表达用户兴趣信息,本文提出了基于分类的用户兴趣模型,该模型涉及对文档的特征值提取,基于搜狗语料的SVM分类器对相关文档进行分类等技术。使用准确率和排序准确率两个指标将baidu搜索引擎和基于VSM的模型及基于分类的模型进行了对比。实验结果表明,本文提出的面向用户兴趣的用户行为分析模型可有效提高用户对搜索结果的满意度。
其他文献
目的观察丹莪妇康煎膏治疗子宫内膜异位症的疗效及安全性。方法 143例患者分为治疗组(87例)和对照组(56例),分别给予丹莪妇康煎膏和孕三烯酮,均连续应用3个月经周期。对患者
园林工程是城市建设的重要象征,在城市园林工程施工过程中,需要遵循科学的施工原则,需要按照科学的施工流程,因地制宜地进行园林工程植被的栽植及养护。特别是在新时期,城市
目的:了解清洁手术抗菌药物的应用情况,为抗菌药物的合理应用和管理提供参考。方法:回顾性调查分析某三甲医院5种清洁手术共153例患者抗菌药物的使用情况。结果:153例患者围
目的:观察APPswe/PS△E9双转基因AD小鼠与正常小鼠脑组织miRNAs的差异表达,探索miRNAs在AD发病机制中的可能作用。方法:采用6月龄APPswe/PS△E9双转基因AD小鼠作为实验组,同月
为了研究采用火焰原子吸收分光光度法分析测定土壤中锌时去酸效果对于测定结果的影响,通过对比几种土壤中的标准物质GSS和ESS的分析测定结果,比较不同去酸程度对分析测定的影
随着职场竞争压力的增大,人们不得不每天面对紧张的生活和工作环境。当这种压力超出个人应对能力时,就会严重影响人们的身心健康状况和工作状态。智联招聘联手战略合作伙伴—
通过测定厦门乳牛场78头黑白花母牛的有关体尺和实际体重,对我国估测乳牛和黄牛体重应用较广的由胸围和体斜长计算体重的两个公式和国外估测乳牛体重采用的由胸围查出体重的
<正>1.病例摘要患者,40岁,因"经期下腹及肛门坠胀痛5年,加重2个月"于2014-06-10收入院。患者5年前出现经期下腹及肛门部坠痛不适,1年前自觉疼痛时间延长,经前期起出现下腹及
目的:了解儿科用药特点,促进儿科合理用药。方法:对儿科用药采用金额排序法进行回顾性统计和分析,并随机抽取我院2009年1—12月的儿科门诊处方10 242张和462份住院病历进行合
本文从两个主要方面详细地阐述了中国固体废物的环境管理.其一是工业固体废物目前的环境管理,包括加快立法,强化监督,开展科学研究,提高综合利用和处理处置技术,加强国际合作