论文部分内容阅读
随着社会的快速发展,英语作为重要的信息载体,已经成为人类生活各个方面广泛使用的语言,堪称“国际语言”。在我国,英语作为一门外语是学校的必修课程,也是学生需要掌握的外语技能。英语写作能力是英语语言综合运用能力的主要组成部分,是考核学生英语水平的一项重要指标。然而,我国学校英语教学中师生比例悬殊,使得在日常的英语教学中,教师要逐一批阅学生英语作文面临着工作量大的问题。因此,研究开发能够分析中国学生英语作文主题与观点的模型,对于研发中国学生英语作文自动批阅系统,减轻英语教师批阅学生作文的工作量,解决课后学生英语写作训练不足的问题都具有重大意义。 本文采用自然语言处理中的潜在狄利克雷分布与基于 SentiWordNet情感词典的观点挖掘的理论与方法,对学生的英语作文主题进行分析,观点进行挖掘。下面是本文为了解决英语作文的主题分析和观点挖掘两个关键问题所进行的研究工作。 (1)提出了英语作文主题分析算法,实现了判断英语作文是否切题、查找范文英语作文集的主题单词、查找待测英语作文的主题单词、计算待测英语作文与范文英语作文集的主题相似度、计算待测英语作文的主题得分的英语作文主题分析功能。 (2)提出了英语作文观点挖掘算法,实现了对计算待测英语作文的情感极性、计算待测英语作文的归一化情感强度、英语作文中情感单词的改变对英语作文观点的影响、与人工对英语作文观点挖掘的比较的英语作文观点挖掘功能的研究。 (3)构建了英语作文主题分析与观点挖掘模型。完成了英语作文主题分析模块、观点挖掘模块的结构设计,进而完成了英语作文主题分析与观点挖掘模型的总体设计,实现了英语作文主题分析与观点挖掘模型的构建。本文构建的英语作文主题分析与观点挖掘模型能够实现对中国学生英语作文的主题分析与观点挖掘。