论文部分内容阅读
随着国际化程度的日益提高,英语学习变得越来越重要。在语言的学习过程中,写作常常扮演着重要的角色。写作者的写作水平可以凸显其掌握语言的熟练程度,要想写出高质量的文章,必须拥有大量的阅读经历及知识储备。然而,对大多数以非英语为母语的学生来说,由于英语阅读经历和知识储备的缺乏,写出高质量的英语文章绝非是一件容易的事。近年来采用各种不同技术的辅助写作系统层不出穷,为用户的写作提供了极大的帮助。然而,大多数系统都将重点放在词汇、短语、语句级别,对于内容级别的研究甚少,没有对写作的内容进行主题方面的提示和推荐,不能有效地解决用户缺乏写作素材或灵感的问题。本文通过分析现有辅助写作系统的优缺点,并结合对用户需求的调查,设计并实现了基于主题推荐的辅助写作系统。本文的研究内容主要有以下几个方面:第一,为了对文章的主题内容进行简单、直接、有效的分析,本文对文章主题词抽取进行了研究。首先,介绍了传统的主题词抽取方法,并且分析了它们的优缺点。其次,使用主题模型LDA结合现有方法,提出了基于LDA模型融合的主题词抽取方法。最后,通过实验进行对比,验证了主题模型LDA所挖掘出的词潜在主题信息可以在一定程度上改进主题词的抽取效果。使用上述方法抽取的主题词主要用于系统中相关文章的检索以及文章相关度的计算第二,为了计算句子之间的语义相似度,本文首先详细分析了多种句子相似度计算方法的优缺点。然后,通过借鉴词向量的表示方式来表示句子,研究并实现了基于词向量的句子相似度计算方法,实验结果表明词向量中蕴含了词的潜在主题、语法及语义等丰富的信息,从而使基于词向量的方法取得了较好的效果。在系统实现中,我们将上述关于句子相似度计算的研究应用于计算文章中句子与输入内容的相似度并对句子进行排序,从而为用户推荐相关内容。第三,本文实现了基于主题推荐的辅助写作系统,并对系统进行了性能评价和系统响应时间的测试。整个系统由词搭配模块、例句实时提示模块和相关内容推荐模块组成,可以在内容级别上为用户提供帮助,在一定程度上解决用户缺乏写作素材或灵感的难题。为了证明系统的实用性,以人工或者机器自动的方式分别对系统中各个模块的运行结果进行了评价。最后,对系统的响应时间进行了测试,测试结果表明系统满足实时性要求。