论文部分内容阅读
个性化信息检索中用户偏好分析是信息检索领域的重要问题,其核心任务是在给定查询的基础上,通过分析用户的行为特征来挖掘用户的偏好,以获取符合用户查询倾向和符合客观规律的信息。本文针对这一任务开展了深入研究工作,论文的主要研究内容归纳为以下三个方面。第一,基于查询划分的信息检索目标分析研究。通过分析查询,挖掘用户的查询意图。本文根据查询的内部结构和语言现象,提出一种新的查询目标识别方法。首先,将查询划分为查询对象和查询意图;其次,对用户的查询意图进行聚类并构成查询意图集合;再次,结合查询对象和查询意图集合来表征用户的查询目标;最后,根据自动估计的查询目标,推荐相应的查询词。这一方法侧重研究和提升查询自动构建的质量,从而借助优化查询源端的语言描述,改进查询质量。第二,基于鼠标滑动行为的用户满意度研究。通过分析用户检索过程中的行为特征,提出一种基于鼠标滑动行为能量消耗的满意度计算方法。首先,分析用户检索过程中的行为特征与用户满意度之间的关联;其次,建立模拟用户行为的量化模型,计算用户鼠标滑动过程中消耗的能量;最后,基于能量消耗推断用户检索过程中的满意度,达到量化满意度并且判断满意度强弱的目的。这一方法侧重研究用户满意度的度量方法,借以优化信息检索系统的反馈质量。第三,基于正确性的最优检索结果发现与论证研究。本文基于Google搜索引擎设计实验平台,基于量化数据验证以下观点:最佳的检索结果应为本源正确的信息。信息的本源正确性是信息自身固有的客观属性,不由用户和任何外界因素左右。在此基础上,提出一种基于正确性的信息检索评测标准,并利用这一标准校验现有基于用户行为的检索系统重排序算法性能。这一工作侧重研究检索过程中正确的检索结果对用户认知的影响(实验表明正确检索结果对用户认知的正面影响较大),从而帮助改进检索系统的排序策略。综上所述,本文针对个性化信息检索中用户偏好分析任务,从三个方面开展了相关工作,旨在提供一种高质量的信息检索反馈标准,返回更加符合用户偏好、用户认知的检索结果。