面向初等数学应用题自动解答的核心技术研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yyx19870907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能的不断发展,自然语言处理领域的不断进步,以自动解答和类人辅导为核心的线上智能教育平台越来越多,对学生的学习起着越来越重要的作用。要想实现线上智能教育系统,关键在于中文文本形式的题目如何被计算机识别,并存储到对应合理的数据结构中进行知识推演。而线上教育系统的自动解答功能则为学生提供了更类人、更有效的学习方式,其中,初等数学应用题是数学领域自动解答功能的难点。本文以自然语言处理技术和谷歌神经网络机器翻译等相关技术作为理论基础,以实现应用题自动解答作为研究目标,讨论研究了初等数学应用题的知识表示、语义理解和自动推演等核心内容,且在此基础上实现了自动解答系统。本文的主要研究为:首先本文的应用题知识表示方式以Kintsch提出的单步应用题知识表示框架为基础,提出一种新的信息框架,囊括了Kintsch的知识表示框架,并扩展了一些新的内容,比如属性槽、单位槽和数量关系槽等。通过实验证明目前提出的信息框架可以表示初等数学应用题的题目信息,并能有效用于自动解答中;其次是语义理解,初等数学应用题的语义理解是指从应用题文本中提取信息并存放于信息框架中,即从文本中提取实体、属性、数量、单位和数量关系,并填到信息框架对应的槽中。对于实体和属性的提取,本文以条件随机场作为理论基础,采用命名实体识别方法,使用CRF++工具包进行命名实体识别,对于数量和单位的提取,本文采用特征模板匹配方法,对于数量关系的提取,本文以机器翻译作为理论基础,采用谷歌神经网络机器翻译(GNMT),准备训练语料,利用GNMT实现应用题语言到数学语言的映射。综上可构建完整的信息框架并用于应用题自动解答中;最后是自动推演,本文提出关系框架来提取应用题题目中的隐藏关系,并利用Maple符号计算实现单步或多步应用题的自动解答,采用自主构建的规则库进行类人答题。其中关系框架依赖于常识关系库与动态实体库,常识关系库以常识知识库和知识图谱为理论基础,自主构建于数据库中,动态实体库是针对每一道应用题文本自动生成的实体及属性库。综合上述的研究,本文构建出初等数学应用题自动解答系统,并具体阐述了这个系统的各个模块及实现方式,并在自主构建的300道测试题库中,达到了自动解答正确率为74%的效果。
其他文献
未来的制鞋工业需以更先进有效的方法,从测量脚型到统计脚型数据、研究脚型规律、脚的生理机能及脚的行走和运动规律、进一步完善修制订鞋楦标准系列,从而设计制作各种鞋楦款
利用地铁35kV供电网络线路纵差保护装置的光纤通信功能,结合开关柜综合保护测控装置的控制逻辑设置,实现变电所之间的安全联锁,以减少运营中因误操作引起的故障,提高供电系统
产业结构问题是我国当前亟须解决的重大问题,产业结构的优化升级是经济均衡增长的关键。在相关理论方法还不够完善的背景下,构建适合国情的产业结构动态优化的理论与方法,为我国
状态估计是电网控制中心能量管理系统基础软件。提高遥测估计合格率是电网应用软件实用化的关键。本文对基础数据质量、电网模型维护及算法处理等影响遥测估计合格率的原因进
<正>信息科技高速发展的时代,也叫做大数据时代。人们的生活越来越多的和大数据联系在一起。在此之中,会计管理也和大数据产生了密切的联系。大数据的出现,对会计从业领域带
通过引入变异系数、基尼系数和泰尔指数刻画长三角地区八个城市房价差异的动态突变过程,从而建立了含突变点的变结构面板协整模型,探究房价变化的主要原因,实证研究表明:长三
禾本科植物世界上约有700属,近10000种。我国共有200余属,1500种以上。种子植物中,禾本科植物是最有经济价值的一科。但是,禾本科在亚科和族的划分问题上一直存在着较大的分
我国是乙型肝炎病毒(HBV)感染的高流行区。相关研究表明,HBV感染不直接造成肝细胞坏死,而是通过机体的免疫系统介导造成肝细胞损伤及炎症发生。慢性乙型肝炎(CHB)患者合并血
掺复合矿化剂的生料配料计算方法丁美荣湖南省建材工业局(410011)1引言目前国内大多数水泥企业应用了复合矿化剂煅烧技术,且多数又选择了萤石、石膏作为复合矿化剂,但在生料配料设计和计
叶灵凤和余秋雨同为学者散文的代表作家。二十世纪四五十年代的叶灵凤与九十年代的余秋雨都以其独特的视角和睿智的笔触抒写了大量脍炙人口的散文随笔。拟从"关注文化和文明的