基于语义信息的问题分类研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:mackolxsbou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息急速膨胀,如何更准确、快速地从海量信息中获取用户真正需要的信息成了一个越来越重要的课题。问答系统具有理解用户以自然语言提出的问题、精准定位和快速抽取问题的正确答案等特点,成为解决此问题的有效手段。问题分类是问答系统的核心组成部分,可以为答案的选择和抽取提供语义限制和约束。在某种程度上,问题分类类似于文本分类,都是通过分析文本中包含的信息来确定文本类型。与文本分类相比较,问题分类面临着许多难题,主要有:1.用于问题表示的特征向量空间维数过大,且特征向量相关性较小。2.问题相对短小,所以形成的特征向量空间过于稀疏。为了克服上述两个难题,本文着眼于特征词语的语义,构造了具有语义支持能力的知识库,并提出了一种基于语义的问题分类方法。本文主要工作有三方面内容:首先,提出了一种基于百度百科自动获取词语语义相似度的方法。该方法将百度百科词条与其相关词条作为图中节点,而且它们之间存在链接关系,然后利用SimRank算法计算百科词条语义相似度。其次,基于百度百科词条之间的语义相似度,提出了一种自动抽取百科词条instance-of语义关系的方法。首先,下载并整理百科开放分类树,将其作为语义知识库的概念层次,然后对语义相近的百科词条进行聚类,并计算各个类别下百科词条所属概念(概念即是百科开放分类),即完成百科词条instance-of语义关系的抽取和语义知识库的构建。最后,提出了一种基于语义知识库的问题分类方法。首先,将问题进行泛化,即将问题中出现的词语转化为所属概念,然后对泛化后的问题集进行特征提取,并利用SVM进行问题分类。为了验证本方法的有效性和可用性,我们以百度知道和手机助手的问题作为实验数据集。实验结果表明,本课题构建的语义知识库能提供语义支持,且基于语义的问题分类方法解决了特征向量空间维数高、相关性小、数据稀疏等问题,取得了较高的准确率。
其他文献
自改革开放以来,中国的经济有了突飞猛进的发展,综合国力不断增强,国际地位和世界的影响力有了显著的提升。越来越多的外国人想学习汉语,了解中国,所以“汉语热”在世界范围
<正> 一、假设条件或引用材料情境,考查学生的知识迁移能力知识迁移能力是一种知识的应用能力,是培养学生创造性思维的一种有效的途径;创设一种假设条件情境,或引用熟悉的情
为理顺政府管理职能,实行政企分开,促进我国铁路健康、有序发展,2013年3月铁道部被撤销,作为物资设备采购主体的原铁道部所属大型铁路企业的招投标管理制度、操作模式以及监
钢轨作为轮轨系统的重要组成部分,是发展高速、重载以及实现繁忙铁路运输的基础。然而钢轨断裂、波浪形磨损、压溃以及疲劳裂纹扩展等摩擦磨损问题造成的列车脱轨、振动等问
目的:本研究通过冰水灌胃法建立便秘型肠易激综合征(irritablebowel syndrome,IBS)大鼠模型后,应用麻枳降浊方对其进行干预性治疗,通过观察大鼠的一般情况、肠道的病理形态学变化
<正>新课标倡导"学习对生活有用的地理",关注生活、关注热点成为高考的重要方向。同时新课程背景下的课程目标强调要对学生进行情感、态度与价值观的教育,要培养学生自主探究
本文分别就康师尧花鸟画艺术前期和后期两个阶段笔墨、题材、绘画风格展开对比与评析,梳理总结康师尧的花鸟画艺术特色。作为“长安画派”中唯一一位执着于以花鸟画为主要艺
复方刺苋根原药材颗粒浸膏体外对大肠杆菌、绿脓杆菌、金黄色葡萄球菌均有不同程度的抑制和杀菌作用。以复方刺苋根颗粒原药材浸膏灌胃给药 ,对家兔肛肠大肠杆菌和金黄色葡萄
企业是为了获取市场的资源,角逐经济的利益,为了一个共同的战略目标而由人(员工)组成的团队。在任何的企业中,从最高首领的企业家到最基层的员工,都有他们各自发展目标而组成