论文部分内容阅读
信息搜索方法的作用是在信息系统里快速准确地查找到用户需要和关心的信息数据,提升搜索的效率和质量。近年来互联网(Internet)技术的高速发展带动着信息系统的数据处理能力跃迁,加快了系统更新迭代的步伐。如春雨医生、去哪儿网、天猫等各大类型的信息系统为了争夺用户的数量和访问流量,向用户提供了海量的数据信息,丰富了用户的选择,也造成了“信息过载”现象,干扰了用户筛选信息的过程,影响了系统的体验感受。面对“信息过载”问题,帮助用户排除无关信息的干扰,快速准确地定位到感兴趣的结果,信息搜索方法的研究与应用具有重要的价值和意义。本文主要从以下三个方面探讨信息搜索方法的研究应用:首先是用户的兴趣偏好模型的构建。本文采用LM-BP神经网络算法训练用户偏好模型,根据用户和项目的特征建立特征属性矩阵,并对矩阵进行降维处理,再利用LM-BP算法进行训练,构建用户—项目评分矩阵,对没有评分的项目进行预测。完成用户偏好模型的建立。经过实验,能够准确地反映用户的兴趣偏好。其次是搜索推荐算法的选取和实现。传统的协同过滤算法的存在稀疏性、“冷启动”以及可扩展性三个方面的问题。(1)面对稀疏性问题的不足,本文采用非目标用户类型区分理论判断用户的推荐能力。描述了基于领域最近邻理论的未评分值填补方法以实现稀疏性问题的缓解。(2)面对“冷启动”问题则通过web日志收集网络访问序列,并阐释了通过计算网络访问序列的相似性,以搜寻新用户的最近邻集合的方法。(3)面对可扩展性问题,阐述了一种适应用户兴趣变化的协同过滤增量更新机制,该机制具有较好的性能。(4)最后本文利用基于灰色关联聚类的协同过滤算法,通过计算用户之间的相似度,通过加权平均得出新用户的偏好模型。最后本文通过实际搭建搜索平台的方式进行搜索方法的效果验证。本课题面向信息系统展开叙述,选取电商系统这一典型的信息系统作为讨论和验证的大背景,主要依托满集网电商平台提供的实验数据支撑和实验条件支持,利用其提供的数据样本进行训练和测试。经过测试,可以在用户搜索时展示个性化的搜索列表,信息搜索方法达到了预期的效果。