Query语义依存分析技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:meal09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的飞速发展使得信息以前所未有的速度产生和传播,面对信息呈指数式增长、垃圾信息泛滥成灾的困境,搜索引擎如何找到对用户真正有用的信息遇到了很大的挑战。在传统的搜索引擎中,用户输入查询(query),搜索引擎返回一个很长的网页列表。它不知道用户在问什么,不知道用户想找什么,只是通过基于关键字匹配的检索方式,把包含有关键词的网页找到;再通过网页排序的算法,将结果列表进行排序以后展示给用户,用户需要在很长的列表中,自己筛选出真正想要的信息。Query语义依存分析技术首先可以改善传统搜索引擎中的网页排序,它能够对query进行深层语义理解,从而更准确的理解用户的需求,减轻用户筛选信息的负担。另一方面,相对于传统搜索引擎,语义搜索近来受到工业界和学术界的广泛关注。和传统搜索引擎给出信息列表不同,语义搜索将所有信息组织成一个庞大的知识库,面对用户的query,它直接从知识库中检索并返回答案。从而用户省去了自己筛选信息的步骤,更快速更直接地达到搜索的目的。Query语义依存分析技术可以帮助语义搜索引擎更深刻的理解用户需求,更准确的在知识库中进行答案的查找。除此之外,query语义依存分析技术还在自动问答、智能个人助手、信息检索、信息抽取等方向有着广阔的应用前景。本文提出了基于规则和基于统计的两个语义依存分析技术,主要研究内容包括:(1)Query语义依存分析和普通句子上的语义依存分析的异同。相对普通句子来说,query具有长度较短且结构松散的特点,因而和普通句子上的语义依存分析技术有很大的差别。(2)Query语义依存分析的依存关系体系的确定,即根据query的特点,以及应用的需求,确定一个合适的依存关系体系。依存关系体系的确定,首先要考虑体系的完整性,是否能把主要的语义现象覆盖住。其次也要考虑技术上的成本、应用的需求等。本文确定了五类语义依存关系,分别是属性、限定、施事、受事、需求。其中限定关系又分了六个子类别,分别是时间限定、地点限定、数字限定、型号限定、疑问限定、否定限定。(3)针对六类特殊限定定义明确简单的特点,提出了基于规则的query语义依存分析技术,包括规则的定义、规则的编制、规则的应用。(4)将语义依存分析问题转换为分类问题,提出了基于统计的query语义依存分析技术,包括语义资源的挖掘、分类特征的设计和选择。最终通过对比和实验说明了规则和统计两种方法的有效性。
其他文献
实验教学评价的研究是提高实验教学质量,进行科学实验教学管理的重要保证。针对当前实验教学评价系统存在的问题,设计开发了高校实验教学评价系统。本文主要工作内容如下: 
随着网络和数字媒体的快速发展,存在于网络上的视频数据呈现爆炸式增长,如何进行有效的管理和版权保护已引起了人们的广泛关注。基于内容的视频拷贝检测(Content-Based Copy De
语音作为一种方便、快捷、有效的交流方式,在人们的日常生活中扮演着非常重要的角色。随着社会科技的不断进步及其人工智能的迅猛发展,语音信号也逐渐成为人-机交互的一种重
随着无线网络和先进移动设备的迅速发展,移动环境下的个性化推荐服务已经引起了人们的广泛关注,在移动环境下要求实时性以及上下文感知的特性应用推荐场景已经有了很多广泛的研
移动Ad Hoc网络,是一类由若干移动通信设备构成的自组织系统。由于Ad Hoc网络中节点移动的随机性,使其拓扑变化频繁,造成网络性能下降,加之伴随各种应用的迅猛发展,人们对Ad Hoc网
当前各种互联网应用都面临着海量数据的存储和处理问题,飞速增长数据对数据处理系统的可扩展性提出了巨大的挑战。以MapReduce为典型的云技术的兴起,为海量数据的处理提供了一
语音情感识别研究是情感计算领域的一个重要组成部分,近年来越来越多的研究者和研究机构都投身于该领域的研究中。传统的基于快速傅里叶变换方法的情感特征提取不得不进行的一
随着3D显示器和交互式多媒体系统的发展,新的3D视频应用,如三维电视(3DTV)和自由视点视频(FVV)已经越来越引起人们的兴趣。为了使这些3D视频应用成为可能,由多视点视频及其对应
RFID技术是一种非接触式自动识别和获取数据的技术,能够有效降低人工成本、提高运作效率,具有巨大的应用前景。为简化RFID系统的复杂度,通常采用RFID中间件作为连接RFID硬件设备
随着图像数据呈现几何级数的快速增长,如何实现对图像数据库更加高效、准确的检索,是众多学者研究的目标和方向。基于内容的图像检索通过提取图像的颜色、纹理、形状等底层特