【摘 要】
:
随着计算机科学技术与人工智能的快速发展,类人答题、机器证明等研究方向成为国内外研究热点。计算机的类人答题与自动推理是指计算机系统以数学文本作为输入,通过自然语言处理技术提取文本中的知识,然后通过知识的推理实现知识的迭代更新过程。实体提取作为自然语言理解的基本任务,在数学文本的知识提取中起到了至关重要的作用,其效果将会直接影响到初等数学的题意理解。本文围绕初等数学领域中的实体提取任务展开相关研究工作
论文部分内容阅读
随着计算机科学技术与人工智能的快速发展,类人答题、机器证明等研究方向成为国内外研究热点。计算机的类人答题与自动推理是指计算机系统以数学文本作为输入,通过自然语言处理技术提取文本中的知识,然后通过知识的推理实现知识的迭代更新过程。实体提取作为自然语言理解的基本任务,在数学文本的知识提取中起到了至关重要的作用,其效果将会直接影响到初等数学的题意理解。本文围绕初等数学领域中的实体提取任务展开相关研究工作,结合初等数学文本特点与自然语言总体过程,将实体提取任务分为实体引入与指代消解两个子任务。基于数学文本的表述特点,本文将数学实体定义为既包含实体类型又包含实体变量的二元组。而数学文本中的实体往往并不是这样完整的二元组,根据实体元素的缺失类型不同将实体缺失分为实体类型缺失、实体变量缺失与实体二元组缺失三种。对于实体类型缺失,本文构建使用基于词序列的BERT-Bi-LSTM-CRF模型进行命名实体标注来将实体所缺失类型进行补全和引入;对于实体二元组缺失,则将其通过数量词展开来转换为实体变量缺失问题;对于实体变量缺失,则采用基于映射规则的方法来确定待引入实体与其他实体的数量关系与对应关系,并针对这些关系来做实体变量的引入工作。由于回指现象的出现使得数学题目的表述对于计算机来说更加难以理解,将指代语还原为其指向的先行语就格外重要。本文提出初等数学中的回指消解总共分为三步:回指语的确定,候选先行语的确定与先行语的合理性评估。在候选先行语的确定步骤中依据指代语和先行语的位置关系将回指分为句间回指和句内回指,并针对两种回指现象提出了不同的候选先行语确定方法。在先行语合理性评估步骤中,提出了初等数学领域中实体的合理性评估方法。基于以上方法,本文设计并实现了融合数学实体引入与指代消解的初等数学实体提取系统,并选取自建题库中的具有指代现象的数学题目对系统进行了综合测试,在测试过程中运行稳定,平均自然语言理解正确率达到了77%,具有很好的实用价值。
其他文献
损伤识别作为结构健康监测的核心内容之一,各种已有的传统识别方法已发展成熟,但是对于结构在环境温度下的损伤识别仍未得到十分理想的结果。对此,本文研究基于环境温度下的损伤识别方法及应用,探讨采用合适的方法剔除温度影响,或者找到不受环境温度影响的结构损伤识别方法。研究表明振型曲率及其改进方法能够有效解决该问题。论文针对振型曲率指标应用的局限性和不足,引入均匀荷载面曲率差(ULSCD)指标,识别环境温度影
前苏联科学技术哲学界把客观事实作为衡量科学技术正误优劣的惟一标准,而排斥价值判断;而随着苏联的解体,俄罗斯科学技术哲学界则把被冷落多年的价值标准提高到一个非常显著
为探究人为干扰较多的城市河流中氨氧化微生物的空间变异特征以及影响因素,以嘉陵江(南充段)流域及其城市支流为研究对象,分别采集城市上、中和下游以及流经城区的河流的表层
在过去十多年中,财务共享中心的数量在全球范围内与日俱增,增长率已经达到25%。目前,位列世界500强中的企业中,有400多家正在实施财务共享服务,这足以体现出跨国企业正逐渐从
对于以水泥为主要材料的路面来讲,它的接缝处的物料是起到避免表层的水分经由缝隙往下流或质地比较硬的物体进入到缝隙之中的,为了防止基层因为受到水的影响而出现唧泥现象,而后
笔者应用免疫组织化学S-P法,探讨上皮钙黏蛋白(E-cadherin,E-ca)在原发性肝细胞癌(HCC)中的表达及其与HCC的侵袭、转移及预后的关系.
目的:探讨中药熏蒸结合康复护理对膝关节骨折术后关节功能障碍患者康复效果。方法:选取我院2018年1月—2019年6月收治的膝关节骨折术后出现关节功能障碍的患者68例为对象。按
目的:探讨胶囊内镜检查时机对不明原因消化道出血患者的效果分析。方法:以2019年2月-2020年2月乐山市人民医院收治的18例不明原因消化道出血患者为对象。分为急诊组(最后一次
我们用三联疗法治疗寻常痤疮取得了较好的疗效,并与单纯西医和单纯中医治疗寻常痤疮的临床疗效对比,三联疗法疗效高于其它两组.
用中医温阳健脾、养阴益气、健脾利湿等法,分三型治疗小儿因抗生素所致脾胃功能下降,疗效满意.