【摘 要】
:
随着互联网上资源和服务的日益增多,人们常常需要借助于搜索引擎来查找相关信息。通用搜索引擎返回的结果包含了大量的杂质信息,用户通常还需要从中筛选符合自己查询意图的结
论文部分内容阅读
随着互联网上资源和服务的日益增多,人们常常需要借助于搜索引擎来查找相关信息。通用搜索引擎返回的结果包含了大量的杂质信息,用户通常还需要从中筛选符合自己查询意图的结果。垂直搜索引擎虽然能返回某一领域的精准答案,但是当用户具有多个查询意图时,需要提交到多个垂直搜索引擎才能得到较为全面的检索结果。如果通用搜索引擎能准确地分类用户的查询意图,进而有针对性的整合一个或多个垂直搜索引擎的结果,并且用不同的方式来展示,则能够提高用户的搜索满意度。传统的意图分类方法通常基于统计机器学习,如果要获得较好的效果则需要大量的人工标注语料。本文通过引入百科知识,在无需大量人工标注的情况下从非统计和统计两个角度来解决意图分类问题。主要内容包括以下几个方面:第一,本文分析了传统意图分类算法面临的几大难题,提出了一种基于百科知识的意图分类算法。算法将用户查询和意图类别分别映射到百科表示空间中,并在此表示空间中使用非统计方法来分类查询意图。最后通过与传统意图分类算法的对比实验来说明该方法的有效性和优越性。第二,本文针对统计分类方法需要大量人工标注数据的局限性,利用每个意图类别的大规模种子词条来模拟真实的用户查询,并以此来训练统计分类器。在相同标注数据规模下,通过与用真实用户查询训练的分类器进行比较说明该方法的有效性。第三,本文融合两种不同的意图分类方法的优点,组合为一个性能更优的意图分类器,并通过在相同数据集上的对比实验来说明融合后带来的优势。本文在传统搜索引擎的基础上,首先根据意图分类结果选择相应的垂直搜索引擎,然后根据意图相关性对搜索结果打分推荐,使搜索结果更符合用户的查询意图。
其他文献
随着Internet的迅速发展,网络的规模也随之变大,结构也越来越复杂,所以对大规模的网络进行研究已成为网络研究的必然。由于网络模拟成本比较低,易于使用等优点,所以网络模拟
垂直搜索引擎技术逐渐在用户生活中占有举足轻重的地位,用户对搜索行业信息的需求逐渐细化,而支持企业信息的垂直搜索引擎并没有得到完善。通过对企业信息搜索引擎的需求分析
随着目前通信产业的不断发展,现如今的移动终端发生了巨大的变化。在2G时代,手机仅仅是用来通话跟短信交流,但是3G却完全不同了,手机终端不再只是用来通话跟发信息,也不单单
目前,人脸检测与跟踪成为越来越活跃的研究课题,其应用前景非常广阔,如智能监控、公安(罪犯识别等)安全验证系统、视频会议、考勤系统、人机交互系统、医学、数字图书馆等。
文件分享是互联网的传统应用,在线视频则呈现爆炸性增长,若能将两者结合提供一体化服务将会带来更好的用户体验。P2P技术已被证明可以用来提供大规模的网络服务,BitTorrent是
无线传感器网络是结合了传感器、无线通信和嵌入式系统三方面技术的新型网络技术,自从被提出后,就引起了人们的极大关注,在医疗卫生、环境监测和军事等领域有着广阔的应用前
随着互联网技术的发展,人们进入了信息化的时代。在这个信息化的时代,信息就意味着财富,如何有效快速获得准确的、有价值的信息成为关键环节。当前,Web上出现了大量的、结构不同
随着物联网的发展和移动终端的普及,越来越多的数字资源被产生,数据安全的挑战也越来越大。尤其是随着云存储技术的普及,人们开始更多将自己的私有数据上传到云端备份,却对数
迭代算法是指那些对初始输入数据集进行多轮反复处理寻找所需近似解或者精确解的算法。它在早期用于数值分析中线性方程组和微分方程等方面的近似求解。经过几十年的发展,迭代
随着计算机视觉技术与工业生产技术的迅速发展,对机械零件尺寸测量精度的要求已经越来越高。因此,如何提高零件尺寸的测量精度已经成为目前研究的重点问题。本文在现有视觉测