论文部分内容阅读
文本分类技术可以提高管理、组织和利用海量电子文档的效率,具有重要应用价值。分类方法的研究一直是机器学习的重要研究领域之一,对分类方法的研究具有理论意义。虽然大多数基于机器学习的文本分类方法都是语言无关的,但是科学地利用语言的特性,可以构建更高性能的文本分类系统。俄语是世界上最重要的语言之一,因此针对俄语的文本分类方法研究具有理论意义和应用价值。
本文针对俄语文本分类中的俄语情感分析任务开展了3个方面的研究:俄语情感分析的主要任务、特征提取、分类方法和数据集调研和分析;基于浅层机器学习方法的俄语情感分析方法效果比较以及基于卷积神经网络网络的俄语情感分析方法。论文通过比较发现,卷积神经网络方法在俄语情感分析任务上可以取得较好的结果,并在此基础上实现了基于卷积神经网络和FastText的俄语情感分析模型。
针对第一个研究内容,论文首先给出了俄语情感分析的任务定义,制定了俄语文本分类系统构建的一般流程;接着总结了常用的文本分类特征集,分析了常用的文本分类方法的原理;最后给出了俄语文本分类研究主要的数据集并分析了俄语的特点。
针对第二个研究内容,论文给出了俄语情感分析任务的评价方法,比较了朴素贝叶斯方法、最近邻方法、支持向量机方法、决策树方法以及神经网络方法在俄语情感分析任务上的效果。
针对第三个研究内容,论文实现了基于卷积神经网络的俄语情感分析系统,比较了深度学习方法与浅层机器学习方法的情感分析效果,得出卷积神经网络方法分类效果较好的结论。在上述工作的基础上,论文提出了卷积神经网络和FastText相结合的俄语情感分析模型,进一步提升了俄语情感分析的效果。
本文针对俄语文本分类中的俄语情感分析任务开展了3个方面的研究:俄语情感分析的主要任务、特征提取、分类方法和数据集调研和分析;基于浅层机器学习方法的俄语情感分析方法效果比较以及基于卷积神经网络网络的俄语情感分析方法。论文通过比较发现,卷积神经网络方法在俄语情感分析任务上可以取得较好的结果,并在此基础上实现了基于卷积神经网络和FastText的俄语情感分析模型。
针对第一个研究内容,论文首先给出了俄语情感分析的任务定义,制定了俄语文本分类系统构建的一般流程;接着总结了常用的文本分类特征集,分析了常用的文本分类方法的原理;最后给出了俄语文本分类研究主要的数据集并分析了俄语的特点。
针对第二个研究内容,论文给出了俄语情感分析任务的评价方法,比较了朴素贝叶斯方法、最近邻方法、支持向量机方法、决策树方法以及神经网络方法在俄语情感分析任务上的效果。
针对第三个研究内容,论文实现了基于卷积神经网络的俄语情感分析系统,比较了深度学习方法与浅层机器学习方法的情感分析效果,得出卷积神经网络方法分类效果较好的结论。在上述工作的基础上,论文提出了卷积神经网络和FastText相结合的俄语情感分析模型,进一步提升了俄语情感分析的效果。