基于相关性分析的信息搜索方法研究与应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户:crazyinlove_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息搜索方法的作用是在信息系统里快速准确地查找到用户需要和关心的信息数据,提升搜索的效率和质量。近年来互联网(Internet)技术的高速发展带动着信息系统的数据处理能力跃迁,加快了系统更新迭代的步伐。如春雨医生、去哪儿网、天猫等各大类型的信息系统为了争夺用户的数量和访问流量,向用户提供了海量的数据信息,丰富了用户的选择,也造成了“信息过载”现象,干扰了用户筛选信息的过程,影响了系统的体验感受。面对“信息过载”问题,帮助用户排除无关信息的干扰,快速准确地定位到感兴趣的结果,信息搜索方法的研究与应用具有重要的价值和意义。本文主要从以下三个方面探讨信息搜索方法的研究应用:首先是用户的兴趣偏好模型的构建。本文采用LM-BP神经网络算法训练用户偏好模型,根据用户和项目的特征建立特征属性矩阵,并对矩阵进行降维处理,再利用LM-BP算法进行训练,构建用户—项目评分矩阵,对没有评分的项目进行预测。完成用户偏好模型的建立。经过实验,能够准确地反映用户的兴趣偏好。其次是搜索推荐算法的选取和实现。传统的协同过滤算法的存在稀疏性、“冷启动”以及可扩展性三个方面的问题。(1)面对稀疏性问题的不足,本文采用非目标用户类型区分理论判断用户的推荐能力。描述了基于领域最近邻理论的未评分值填补方法以实现稀疏性问题的缓解。(2)面对“冷启动”问题则通过web日志收集网络访问序列,并阐释了通过计算网络访问序列的相似性,以搜寻新用户的最近邻集合的方法。(3)面对可扩展性问题,阐述了一种适应用户兴趣变化的协同过滤增量更新机制,该机制具有较好的性能。(4)最后本文利用基于灰色关联聚类的协同过滤算法,通过计算用户之间的相似度,通过加权平均得出新用户的偏好模型。最后本文通过实际搭建搜索平台的方式进行搜索方法的效果验证。本课题面向信息系统展开叙述,选取电商系统这一典型的信息系统作为讨论和验证的大背景,主要依托满集网电商平台提供的实验数据支撑和实验条件支持,利用其提供的数据样本进行训练和测试。经过测试,可以在用户搜索时展示个性化的搜索列表,信息搜索方法达到了预期的效果。
其他文献
随着社会对全民健身的重视,青少年作为实施全民健身计划的重点对象,有必要对青少年体育中的龙头品牌赛事进行研究。本文主要对阳光体育大会赛事品牌建设现状进行研究,从2011
在对有机发光二极管(organic light emitting diodes,OLEDs)的研究中,反系间窜越(reverse intersystem crossing,RISC)是一个非常重要的物理机制,也是目前的研究热点。这是因
深度学习是一类以多层神经网络为特征的机器学习方法的统称。近年来,深度学习在图像识别、自然语言处理等领域已得到广泛应用。深度学习适于高样本量、高维度问题场景下的机
随着水利水电工程建设的快速发展,宽尾墩+阶梯溢流坝+消力池一体化消能工逐步引起了大家的关注。它因具有消能率高、节约工程投资等特点而被广泛应用于许多高坝泄洪工程中。
京津冀一体化战略的实施,使三省市体育产业形成协同发展趋势,但三省市体育协同发展机制欠缺、资源发掘不充分、整合共享不够等问题仍是京津冀协同发展的重要难关。本研究运用
遥操作系统对处理远端危险环境下的任务具备极大优势,这些优势体现在对未知环境的适应性和操作的灵活性上,这对提升灾后救援、未知空间探索等能力具有重大的理论研究价值。虽
近些年来,有机光电材料被广泛应用于各种电子器件的制备,其中有机发光二极管(OLED)因其同时具有轻、薄、省电和自发光等优点,在光学显示和固态照明领域展示出巨大潜力,同时也
二十世纪初,电子二极管的出现开启了电子科学发展的黄金时代,集成电路的出现开拓了电子器件微型化的道路。随着电子技术的快速发展,对电子器件的集成度要求越来越高,传统电子
近年来,随着航空航天和医疗等行业对加工精度和效率要求进一步提高,五轴数控机床(FAMT)在复杂工件精密制造中的应用变得越发普遍,然而机床结构内部的热源(如滚珠丝杠、轴承、
信息抽取(Information Extraction)技术是指从非结构化数据当中提取用户感兴趣的信息,形成结构化的存储或提供即时检索功能的技术。最近几年来随着深度学习技术的快速发展,信