基于分布式表示的汉语问答系统

来源 :青岛理工大学 | 被引量 : 0次 | 上传用户:maruijun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统可以视为信息检索问题的一种特殊形式。给定一个文档集合,一个问答系统致力于找到这个使用自然语言形式提出来的问题的答案。问答是一个多学科的课题,它包括了信息技术,人工智能,自然语言处理,知识和数据管理和认知科学。从技术的角度来说,问答系统使用了自然的或者统计的语言处理技术,信息检索技术,知识表达和推理技术作为潜在的构建模块。它包括了文本分类,信息抽取和总结技术。一般上讲,问答系统有三个部分:问题分类,信息抽取,答案抽取,这些成分扮演着不可或缺的角色在问答系统中。问题分类扮演者初级的角色在问答系统中,依据问题中实体的类型来分类问题。信息检索技术通过他们智能的问答系统抽取可应用的答案来获得一种识别的上的成功。最后,提出主题从答案抽取模块中,而这些模块通常需要排序操作,并验证候选答案。本课题的研讨内容有以下几个方面:(1)本文研究了不同粒度语义单位的分布式表达,从词语,短语,句子到段落和篇章。本文介绍了分布式语义表示的概念,比较了不同种类的构造分布式表的方法,并比较了各种方法的优劣。现有的语义分布式表示学习主要侧重于词和短语的表示学习,对于句子和篇章的分布式表示学习方法还处于开始阶段。(2)本文研究基于知识库的问答系统。语义知识库对于构架问答系统来说必不可少,而目前获取语义知识大多数来源于结构化数据,且大部分集中于英语方面,在汉语语义知识如何获取方面还要进一步的探索。由于不同种语言的知识库之间是相互独立的,因此多语言知识库的融合方法也值得探讨。本文构架了本系统所需要的关于地理方面的汉语知识库,由大量从百科中抽取到三元组组成。(3)本文将语义分布式表示加入融合到基于知识库的问答系统中,把问题句子和候选答案同时转化成分布式语义表示的向量,训练时通过梯度下降算法使得问题和正确答案在语义空间上相似度更大。进一步的工作致力于使用结构更复杂,学习能力更强的神经网络来提高系统表现。通过实验表明,使用语义分布式表达结合到基于知识库的问答系统中,将问题和候选答案通过神经网络映射到同一个向量空间,来计算空间上的语义相似度,取得了比较不错的结果。
其他文献
近年来,嵌入式实时数据系统被广泛应用于工业控制、信息通讯、网络传输以及金融等领域。这类系统要求具有无人工干预的运行能力,要求事务具有良好的自适应能力和应变能力。项
信息科技的突飞猛进,特别是九十年代以来多媒体信息的迅速膨胀,使得数字图像记录设备保有量大大增加,每天产生数以万计的视频,这些视频包含了生活的方方面面。海量的视频量给人们
传统基于内容的图像检索中存在的语义鸿沟问题使得仅凭图像的低层视觉特征进行匹配检索难以获得较理想的效果。为缩小语义鸿沟,人们引入了相关反馈技术。该技术可从用户与检
在无线传感网络实际应用中,网络通常部署于难以掌控或者条件恶劣的环境当中,如危险区域远程控制。在应用现场部署阶段、以及网络长期运行过程中,网络服务质量和系统运行状况在节
本文的重点研究对象是微博评论信息的倾向性分析,主要的研究内容是以新浪微博中的评论为研究对象并且对评论中的情感倾向进行研究。本研究是将几种特征进行提炼、融合通过改
人机博弈是被认为是人工智能领域最具挑战性的研究方向之一,人机博弈的研究对象主要是棋牌类游戏,而棋牌类游戏又可以分为完全信息游戏和不完全信息游戏,四国军棋是典型的不
在过去的研究中,手臂动作的识别多集中在计算机视觉领域,采用摄像头,智能眼镜等设备来捕捉获取动作的图像信息,进而对图像信息进行识别。而随着科学技术的发展,传感器设备的
无线传感器网络(Wireless Sensor Network)是一种由传感器、微处理器和无线通信接口组成的新型网络。由于它采用全新的信息处理和获取技术,所以在医疗和军事等领域有了广阔的
随着计算机图形学的快速发展,真实感图形学已经成为计算机图形学的核心内容之一。全局光照计算是场景绘制迈向真实感的一个必要手段,如何实现更好的全局光照算法,在更短的时间内
安全协议是以密码学为基础的协议,它在因特网和分布式系统中提供各种各样的安全服务。近年来,利用形式化方法分析安全协议正在成为一个新的趋势。本文首先在分布式时序逻辑的