论文部分内容阅读
伴随着信息技术的迅速发展,人工智能技术的应用范围也越来越广泛,生活中各个领域都可窥见一斑。智能解答的研究也受到越来越多研究者的关注与重视,机器解答应用题的研究取得了一定的成果,且研究的广度与深度都不断加强。发现题目特点,总结题目规律,是数学解题理论的基本任务。小学数学中应用题是令很多学生最困扰的问题,应用题题目类型繁多,提问方式灵活多变,分析题意找等量关系抑或不等关系是最为关键的步骤。但应用题中许多看似不同的题目却又有很多相同点,其结构特点也有规律可寻,把握其共同特点,进行系统归纳分析,可以总结出通用的解题方法。这里便需要借助分类的思想去解决。分类研究体现在机器学习上是用以体现问题表征是否正确的方法,体现在学习者上,则表明解题者对不同类型题目的概念性知识的理解及运用能力。本文的主要研究对智能解答小学数学应用题起前提性、基础性的作用,题目分类的效果直接关系到机器解答的准确性。首先,论文系统阐述了文本分类的一般过程及分类模型,重点描述分类器如何实现分类的思想理论及核心方法。其次,对小学数学应用题隐含关系题目进行文本预处理及向量化表示,详细解释题目语料的选择,隐含关系类型题目的预处理过程,中文分词、过滤停用词、特征提取和加权及使用多维数组对文本进行向量化表示,使题目文本以分类器更加易于处理的方式来表示,恰当的文本表示形式对分类器进行处理的效率和准确度都有很大的影响。再次,详细分析多分类的方法选择与分类器模型的构建,对题目文本进行分词和过滤停用词得到初始特征集,通过频率统计方法进行特征提取和基于词频的统计方法统计词频,用TF-IDF函数对文本特征进行加权处理,使用VSM空间向量模型对题目文本进行表示,将训练文本特征的空间向量表示模型输入分类器进行训练,得到题目分类的系统分类模型。待测试文本,以训练得到的分类模型为实验模型,将测试题目文本输入系统进行测试,得到分类结果,将每个题目归类到相应的类别当中去。最后,对题目文本的分类结果进行统计分析,运用F-测量指标综合评价应用题题目文本的分类的准确率,与分类效率等因素。