【摘 要】
:
几十年来的研究历史显示应用题机器求解是机器解答的一个难点问题,相关研究对于智能教育具有重要的理论意义和实际应用价值。随着深度学习和大数据技术的快速发展,数据驱动的深度学习方法日益成为其研究的主流范式。然而在现阶段,对于小学应用题机器解答研究,依然缺乏数据有效完整、类型清晰的高质量海量测试数据集,和针对性的数据分析工具,严重影响了相关深度学习模型的准确评估和高效率设计。基于以上分析,本研究面向小学应
论文部分内容阅读
几十年来的研究历史显示应用题机器求解是机器解答的一个难点问题,相关研究对于智能教育具有重要的理论意义和实际应用价值。随着深度学习和大数据技术的快速发展,数据驱动的深度学习方法日益成为其研究的主流范式。然而在现阶段,对于小学应用题机器解答研究,依然缺乏数据有效完整、类型清晰的高质量海量测试数据集,和针对性的数据分析工具,严重影响了相关深度学习模型的准确评估和高效率设计。基于以上分析,本研究面向小学应用题机器求解算法测试评估平台系统设计,针对其中的数据有效性和完整性判别、面向小学数学应用题表征聚类分析、数据可视化三项关键技术展开研究。具体研究内容包括:(1)面向小学数学应用题文本数据有效性和完整性判别。尽管当前大多数数据清洗算法可以识别文本中的非法字符、重复数据和停用词等信息,然而这些算法无法从语义层面确保数据有效性和完整性以至于需要耗费大量人力来鉴别数据文本是否为有效的应用题,以及表述是否完整。因此,如何从语义层面确保数据有效性和完整性是本文第一个研究重点。(2)面向小学数学应用题表征聚类分析。应用题在表述层面具有多样性,但如果涉及相同的数学模型,则为同一类型的题目。而对不同类型的应用题的解题能力是评估机器求解算法的重要指标。尽管当前可以使用词向量表示题目文本,然而词向量表示的是词的语义信息,简单使用词向量表示题目文本无法有效揭示应用题内含的数学关系。因此,面向小学数学应用题表征聚类分析是论文的第二个研究重点。(3)面向小学数学应用题的数据分析可视化工具。数据可视化技术能够使我们快速的发现数据中包含的模式和规律,是相当高效的数据分析方法。然而,机器求解算法会生成海量的、多维度的数据,现有的数据可视化工具ECharts、D3等无法解决数据维度问题。因此如何解决数据维度问题是论文的最后一个研究重点。论文创新点:1、论文提出了一种句法语义模型来对源数据进行数据有效性和完整性检测和处理,该模型根据题目文本与知识库中知识点的映射关系,提取题目中所包含的等式关系来判别文本数据有效性与完整性。论文在Math23K数据集中的实验结果表明,该模型对有效完整的数学应用题目和纯数字运算题的识别准确率达到100%,对不完整数据识别准确率达到93%,证明了该模型的有效性。2、论文提出了一种题目文本向量化的新方法,即将数学知识库进行向量化,用向量化的数学知识点表示题目文本。然后通过聚类算法对向量化的数学题目进行聚类,并根据聚类结果表示应用题类型,以此作为一个重要指标来评估机器求解算法的解题能力。论文在公开可用的Math23K数据集上进行了实验证明了所提出方法的有效性。3、在面向小学数学应用题的数据分析可视化工具中,针对机器求解算法生成的海量的、多维度的数据,集成了t-SNE算法进行数据降维。研究人员在进行数据可视化过程中,面对高维数据不再需要单独进行数据降维等预处理操作,增加了研究人员进行数据分析的效率。
其他文献
<正>一、前言日本军国主义1931年侵略我国东北的“九·一八”事变后,1937年又进而发动了全面的侵华战争。日本国土小,人口少,在兵源和军备物资匮乏的情况下对我发动这场战争,而且又在短短的两年间(1937—1938)就占据了我大片国土。原因何在?奥秘何在?这一不解之谜,后人认为这是“历史上被隐瞒的一章”。战后,不断有消息透露,日军曾大规模地研制细菌武器,至于日军在战场上是否大规模使用过细菌武器这一
2018年3月,最高人民法院、最高人民检察院出台《关于检察公益诉讼案件适用法律若干问题的解释》,从司法层面确立刑事附带民事公益诉讼制度。作为一项创新型诉讼制度,环境刑事附带民事公益诉讼具有及时维护公共利益、提高诉讼效率等特点,因此成为当前公益诉讼的实践重点。这一制度属于刑民交叉,又是刑事附带民事诉讼与公益诉讼的结合,具有特殊的复合性,即使有《民事诉讼法》和《刑事诉讼法》作为制度基础,仍存在诸多理论
债权融资在现代公司的资本结构中扮演着重要角色。随着公司资本注册最低限额的取消,公司债权人利益保护更显重要。传统公司法认为董事仅对公司承担信义义务,而债权人作为公司外部第三人不应受到董事信义义务的保护。本文就在公司注册资本最低限额取消的背景下,从分析董事治理模式变迁的角度入手,分析董事不良行为如非法转移公司资产、在资不抵债的情况下拖延破产重整和解申请、投机交易等等对债权人可能造成的损害,从理论角度和
2020年初,新冠肺炎疫情的爆发将在线医疗推上了风口浪尖。在随后一年中,在线医疗逆势发展,其普及程度与大众认知度大幅提升,推动了在线医疗行业在大众中逐步渗透。美团专业药房、小荷医疗、百度健康、平安好医生等行业巨头林立,旨在搭建线上线下融合的一站式医疗服务渠道。然而,无论是线上平台还是线下医疗机构,其服务模式始终强调围绕用户展开。是以,为更好满足用户在健康医疗方面的信息服务需求,众多在线健康社区竞相
量词是语言系统中特有词性的标志,世界上并不是每种语言都有量词,多数亚洲国家的语言会使用量词,比如汉语、日语、越南语、泰语等,汉语和泰语同属汉藏语系,汉藏语系的显著特点之一就是有丰富的量词,两种语言的量词用法存在差异,汉泰语指人量词无论是名量搭配、语义特征还是语义场、重叠形式都有所不同相关学者在汉语和泰语对指人量词等方面都有相应研究,相关学术界,泰语对指人量词的研究并不广泛,并且还没有学者对汉泰语指
2017年修改的《行政诉讼法》新增第25条第4款,规定了环境行政公益诉讼程序,并对环境行政公益诉讼诉前程序制度作出具体规定。2018年,在全面总结环境行政公益诉讼试点成果后,最高人民检察院与最高人民法院共同制定《最高人民法院最高人民检察院关于检察公益诉讼案件适用法律若干问题的解释》,对环境行政公益诉讼及诉前程序作了进一步的规定。诉前程序因其创新性规定,在维护公共利益方面发挥着独特作用,具有节约司法
环境犯罪是破坏生态环境的严重违法行为,传统刑法理论认为环境犯罪侵害的法益是国家生态环境管理制度,忽视了犯罪行为直接造成环境污染、生态系统破坏之严重后果。传统刑法在保护生态环境法益方面显得力不从心。为贯彻运用司法手段保护生态环境的政策,各地司法实践广泛采用补植复绿、增殖放流、土地复垦及支付修复金等恢复性措施,修复受损生态环境,试图通过刑事审判达成惩罚犯罪与修复受损生态环境之双重功能。与司法实践的“热
每所大学、学院、培训机构等都会有独立的汉语教学培养方案、教学方法、课程设置、选用的教材、师资汉语水平等。这些因素对每所学校的教学质量与学生汉语水平有着极大的影响。目前塔吉克斯坦开设汉语课程的学校主要有开设汉语专业教育的和开设非汉语专业教育的学校。国立语言学院是塔吉克斯坦一所语言类专业型的学院,在语言教育方面有较强的优势,而且它是全国第二所开设汉语专业的学院,但目前尚没有学者针对国立语言学院的汉语教
“给予”类动词属于三价动词,是双宾语句中的一类词语,在汉语作为第二语言的教学中,它也是较为重要的。目前,“给予”类动词的研究虽然取得了一些成果,但主要集中在语言本体研究方面,在对外汉语教学领域上的研究成果相对较少。本文以在泰国学习汉语的泰国学生为主要调查对象,使用二语习得理论,采用文献研究法、调查分析法、访谈法和偏误分析法,对泰国学生习得汉语给予类动词“发、送、交、寄”的情况做了一个较为详细的调查
住房租赁登记备案是指出租人和承租人签订、变更住房租赁合同时,由法定申请人到法定登记机关申请登记,经依法审核,登记机关在登记备案系统予以登记备案的法律制度。长期以来,“登记备案率低”严重影响住房租赁登记备案制度目的的实现,制度虚置已经成为登记备案制度最大的障碍。解决备案率低的表面问题,必须通过深入研究住房租赁登记备案制度的产生历史和存在的根本性问题。近年来,我国重点培育和发展住房租赁市场,为住房租赁