基于语义信息的问题分类研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户：mackolxsbou

【摘要】

：

随着信息急速膨胀,如何更准确、快速地从海量信息中获取用户真正需要的信息成了一个越来越重要的课题。问答系统具有理解用户以自然语言提出的问题、精准定位和快速抽取问题

【作者】

：

尹坤

【出处】

：

西南交通大学

【发表日期】

：

2014年期

【关键词】

：

语义知识库百度百科语义相似度 instance-of 问题分类 SVM

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息急速膨胀,如何更准确、快速地从海量信息中获取用户真正需要的信息成了一个越来越重要的课题。问答系统具有理解用户以自然语言提出的问题、精准定位和快速抽取问题的正确答案等特点,成为解决此问题的有效手段。问题分类是问答系统的核心组成部分,可以为答案的选择和抽取提供语义限制和约束。在某种程度上,问题分类类似于文本分类,都是通过分析文本中包含的信息来确定文本类型。与文本分类相比较,问题分类面临着许多难题,主要有：1.用于问题表示的特征向量空间维数过大,且特征向量相关性较小。2.问题相对短小,所以形成的特征向量空间过于稀疏。为了克服上述两个难题,本文着眼于特征词语的语义,构造了具有语义支持能力的知识库,并提出了一种基于语义的问题分类方法。本文主要工作有三方面内容：首先,提出了一种基于百度百科自动获取词语语义相似度的方法。该方法将百度百科词条与其相关词条作为图中节点,而且它们之间存在链接关系,然后利用SimRank算法计算百科词条语义相似度。其次,基于百度百科词条之间的语义相似度,提出了一种自动抽取百科词条instance-of语义关系的方法。首先,下载并整理百科开放分类树,将其作为语义知识库的概念层次,然后对语义相近的百科词条进行聚类,并计算各个类别下百科词条所属概念(概念即是百科开放分类),即完成百科词条instance-of语义关系的抽取和语义知识库的构建。最后,提出了一种基于语义知识库的问题分类方法。首先,将问题进行泛化,即将问题中出现的词语转化为所属概念,然后对泛化后的问题集进行特征提取,并利用SVM进行问题分类。为了验证本方法的有效性和可用性,我们以百度知道和手机助手的问题作为实验数据集。实验结果表明,本课题构建的语义知识库能提供语义支持,且基于语义的问题分类方法解决了特征向量空间维数高、相关性小、数据稀疏等问题,取得了较高的准确率。

其他文献

对外汉语教学中文化冲突案例分析及应对策略研究

自改革开放以来,中国的经济有了突飞猛进的发展,综合国力不断增强,国际地位和世界的影响力有了显著的提升。越来越多的外国人想学习汉语,了解中国,所以“汉语热”在世界范围

学位

对外汉语教学文化冲突应对策略

浅谈高考中地理问题的情境设置与能力考查

<正> 一、假设条件或引用材料情境,考查学生的知识迁移能力知识迁移能力是一种知识的应用能力,是培养学生创造性思维的一种有效的途径;创设一种假设条件情境,或引用熟悉的情

期刊

情境设置能力考查高考题推理判断地理问题直布罗陀海峡

大型铁路企业物资设备招投标管理改革研究与实践

为理顺政府管理职能,实行政企分开,促进我国铁路健康、有序发展,2013年3月铁道部被撤销,作为物资设备采购主体的原铁道部所属大型铁路企业的招投标管理制度、操作模式以及监

学位

铁路企业物资设备招投标管理

钢轨磨损特性实验研究与数值分析

钢轨作为轮轨系统的重要组成部分,是发展高速、重载以及实现繁忙铁路运输的基础。然而钢轨断裂、波浪形磨损、压溃以及疲劳裂纹扩展等摩擦磨损问题造成的列车脱轨、振动等问

学位

轮轨关系磨损数值分析偏最小二乘法

麻枳降浊方对便秘型肠易激综合征模型大鼠肠组织MC的影响

目的：本研究通过冰水灌胃法建立便秘型肠易激综合征（irritablebowel syndrome,IBS）大鼠模型后，应用麻枳降浊方对其进行干预性治疗，通过观察大鼠的一般情况、肠道的病理形态学变化

学位

麻枳降浊方便秘型肠易激综合征MC复方芦荟胶囊西沙比利

城市形成和发展的条件

期刊

重心位置形成和发展地理位置社会生产方式纬度位置世界大城市区域地理对外联系门户位置

以热点事件为背景设计开放式问题——以地理选修模块为例

<正>新课标倡导"学习对生活有用的地理",关注生活、关注热点成为高考的重要方向。同时新课程背景下的课程目标强调要对学生进行情感、态度与价值观的教育,要培养学生自主探究

期刊

开放式问题背景设计景区门票阅读材料热点事件

画花如画人—康师尧花鸟画艺术研究

本文分别就康师尧花鸟画艺术前期和后期两个阶段笔墨、题材、绘画风格展开对比与评析,梳理总结康师尧的花鸟画艺术特色。作为“长安画派”中唯一一位执着于以花鸟画为主要艺

学位

康师尧花鸟画长安画派文人画

复方刺苋根颗粒治疗ⅠⅡ期内痔药效学研究

复方刺苋根原药材颗粒浸膏体外对大肠杆菌、绿脓杆菌、金黄色葡萄球菌均有不同程度的抑制和杀菌作用。以复方刺苋根颗粒原药材浸膏灌胃给药 ,对家兔肛肠大肠杆菌和金黄色葡萄

期刊

复方刺苋根颗粒药效学痔实验研究

基于焦裕禄精神特色的中信重工企业文化研究

企业是为了获取市场的资源,角逐经济的利益,为了一个共同的战略目标而由人(员工)组成的团队。在任何的企业中,从最高首领的企业家到最基层的员工,都有他们各自发展目标而组成

学位

企业文化焦裕禄精神以人为本企业精神

基于语义信息的问题分类研究

其他学术论文