个性化信息检索中用户偏好分析技术研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:tzwizj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化信息检索中用户偏好分析是信息检索领域的重要问题,其核心任务是在给定查询的基础上,通过分析用户的行为特征来挖掘用户的偏好,以获取符合用户查询倾向和符合客观规律的信息。本文针对这一任务开展了深入研究工作,论文的主要研究内容归纳为以下三个方面。第一,基于查询划分的信息检索目标分析研究。通过分析查询,挖掘用户的查询意图。本文根据查询的内部结构和语言现象,提出一种新的查询目标识别方法。首先,将查询划分为查询对象和查询意图;其次,对用户的查询意图进行聚类并构成查询意图集合;再次,结合查询对象和查询意图集合来表征用户的查询目标;最后,根据自动估计的查询目标,推荐相应的查询词。这一方法侧重研究和提升查询自动构建的质量,从而借助优化查询源端的语言描述,改进查询质量。第二,基于鼠标滑动行为的用户满意度研究。通过分析用户检索过程中的行为特征,提出一种基于鼠标滑动行为能量消耗的满意度计算方法。首先,分析用户检索过程中的行为特征与用户满意度之间的关联;其次,建立模拟用户行为的量化模型,计算用户鼠标滑动过程中消耗的能量;最后,基于能量消耗推断用户检索过程中的满意度,达到量化满意度并且判断满意度强弱的目的。这一方法侧重研究用户满意度的度量方法,借以优化信息检索系统的反馈质量。第三,基于正确性的最优检索结果发现与论证研究。本文基于Google搜索引擎设计实验平台,基于量化数据验证以下观点:最佳的检索结果应为本源正确的信息。信息的本源正确性是信息自身固有的客观属性,不由用户和任何外界因素左右。在此基础上,提出一种基于正确性的信息检索评测标准,并利用这一标准校验现有基于用户行为的检索系统重排序算法性能。这一工作侧重研究检索过程中正确的检索结果对用户认知的影响(实验表明正确检索结果对用户认知的正面影响较大),从而帮助改进检索系统的排序策略。综上所述,本文针对个性化信息检索中用户偏好分析任务,从三个方面开展了相关工作,旨在提供一种高质量的信息检索反馈标准,返回更加符合用户偏好、用户认知的检索结果。
其他文献
膜计算是生物计算中一个新的分支,它是从生物体活细胞的结构和功能中抽象出来的计算模型。膜计算也被称为膜系统或P系统。这个研究方向由罗马尼亚科学家Gheorghe.P un于1998年
我国配电网大部分为中性点谐振接地系统,在配电网架空线路的各类故障中,单相接地故障占比最大。在线故障检测和定位是智能电网自愈功能实现的基础,目前故障选线应用比较成熟,在线故障定位基于故障选线提出,目的在保证电力供应的情况下迅速确定、排除单相接地故障,提高供电可靠性。在线故障定位首先需要获取准确的配电网运行信息,配电网分布范围较广,分支繁多,物联网中的许多方法和技术,对准确、快捷采集电网运行时的状态信
近年来,面向服务架构(SOA)已成为系统集成的主要解决方案,SOA的提出在一定程度上解决了多个应用集成的问题。SOA架构的基础设施是企业服务总线(ESB),随着企业业务复杂度的增
随着计算机软硬件和互联网技术的飞速发展,云计算技术得到了广泛的应用。各种不同规模的云数据中心在世界范围内普及开来。然而,如此数量庞大的云数据中心带来的是一个严重的
僵尸网络是融合了当前计算机病毒、网络蠕虫和特洛伊木马等恶意软件技术的、能够可控的发起各种网络攻击活动的平台。在与安全研究者的不断对抗中,僵尸网络使用各种网络协议
语音情感识别技术具有广泛的应用前景,因此语音情感的识别研究具有重要的意义。本文以生气、高兴、中性、悲伤四种情感状态为例,对情感特征的提取、选择以及识别方法进行研究,主
交通、电力、军事等关键领域对软件的可靠性和安全性要求越来越高,因为其严重关乎国民的人身和财产安全。C语言在上述基础领域软件的开发中有广泛的应用。C语言灵活高效的特性
本文首先介绍了H.264/AVC所使用的编码技术,H.264/AVC是较新的视频编码标准,它在以往视频编码标准的基础上进行了改进和升级。由于使用了新的编码技术,经过H.264/AVC编码的视频
近几年来,随着教育数据挖掘领域的快速兴起,结合数据挖掘方法对学生行为数据进行分析成为一种流行趋势,主要致力于对未来行为与兴趣的发现、对学生学习表现的预测、以及学生个人
随着互联网图像数据的海量增长以及人机交互系统的快速发展,如何对图像进行有效的组织分类,便于人们在浩如烟海的图像资源中快速找到想要的图像,成为人们越来越关注的问题。近年