基于问答库的检索式问答系统研究与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:lu_bright_zhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0时代已历十余年。随着互联网的高速发展和移动终端的迅速普及,由用户主导产生的信息日益膨胀。如此规模庞大的信息导致用户信息过载,从而倒逼搜索引擎技术的快速发展,使用户能够快速准确地获取所需信息。以关键词匹配和网页链接为基础的搜索方法已趋于成熟,但多数情况下由于用户选择关键词不当,导致检索结果不理想;或因搜索引擎不能过滤大量的网页,导致用户得不到准确的答案。相比之下,问答系统以自然语言作为输入,不依赖于用户对关键词的选择,并直接返回最相关答案内容,它提高了用户检索满意度并节约了用户获取答案的时间。本文在此背景下对基于问答库的检索式问答系统展开研究,主要研究工作包括以下三个方面:(1)对基于依存关系的文本相似度算法进行研究和分析,并提出一种基于依存关系选择与加权的文本相似度算法,实验结果表明该方法在不同的数据集上,其准确率均具有较大优势。(2)本文结合基于向量空间模型(VectorSpaceModel,VSM)、依存关系和卷积神经网络(ConvolutionalNeuralNetwork,CNN)的文本相似度特征,通过RankSVM排序模型,提出了一种基于多相似性特征融合的问答检索模型,实验结果表明该问答检索模型具有较高的F1值和准确率。(3)通过对问答检索模型的实现,本文基于从天涯问答社区爬取的问答数据,使用SAE(SinaAppEngine)和微信公众号实现了一个检索式问答系统。
其他文献
<正>作品名称:广西壮族文化主题酒店室内设计作品简介:本作品为广西壮族文化主题酒店室内设计方案。以下分别为酒店前厅、餐厅、客房的方案设计。前厅的界面主要用了壮族的地
光子和磁子相互作用所形成的磁子激元作为一种重要的元激发因其有望在量子信息领域实现量子存储和量子传感器而受到众多研究者的极大关注。而在微波开口环谐振器中实现光子和
新中国的金融事业是和中华人民共和国共同诞生、一起成长的,这60年里,我国不但创建起完备的金融体系和货币制度,而且凭借不断增长的综合国力、稳健的金融体系和金融调控能力,
近些年,高校学生的伤害事故层出不穷,高校承担的侵权责任也成为全社会关注的话题.2010年我国《侵权责任法》的颁布,对确认高校校园侵权责任的归责原则、责任认定等方面有很大
1911年清朝政府把民办铁路收归国有,掐死了通过铁路股票而发展出的公众广泛参与的资本市场,也阻断了中国人通过铁路公司发展引入现代型大企业管理的道路后发国家的铁路现代社
就目前而言,我国高校关于财务管理方面的研究取得了一定的进展,然而其不具备节约思想的指导,并且所进行的研究大多注重高校财务的单个方面,虽然在某些区域取得一定的成果,但
目前,世界上很多国家都将美国的高等教育视为值得借鉴的成功经验,德国也不例外,在2004年进行了高等教育改革,引入了教师绩效薪酬制和博士生课程。但是,德国和美国具有不同的
民族音乐是民族文化的一种体现,在当今社会日益进步的环境下,韩国传统民谣说唱艺术也向着多元化方向发展,民谣说唱的起源与形成标志着韩国传统音乐的特性。说唱艺术“盘索里(
<正>目前,有关断裂核酸的人工酶包括稀土及其大环配合物,而稀土在碱性条件下易形成沉淀,影响了它们在水溶性介质中的应用。稀土大环配合物对核酸的断裂具有较高的选择性,但其
会议
该文了解我国妇女分娩年龄现状及妊娠年龄与妊娠期高血压疾病之间的关系。方法:回顾性调查2011年中国大陆北京、上海、吉林、辽宁、江苏等14个省、市、自治区39家医院妊娠满2