BiGRU-CapsNet文本分类模型研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:long_drago
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是文本挖掘中非常重要的环节,在人工智能时代有着巨大作用。对于文本分类,传统方法以人工提取特征的机器学习模型为主,但随着神经网络结构的不断发展,深度学习在语言、图像等领域取得巨大突破,其特征表示能力远超传统方法。本文以提高文本分类模型的分类性能为目标,详细介绍基于传统机器学习算法的文本分类一般流程,以及常用的文本表示方法和文本分类性能评估。本文主要利用深度学习模型进行文本分类的研究,相关内容如下:(1)TextCNN和双向门限循环单元网络(Bidirectional Gated Recurrent Unit Network,BiGRU)模型。这两种模型可在原始文本输入的基础上更好的实现端到端分类,从而可避免手工设计特征等问题。经特定数据集验证后,相对于κ近邻、支持向量机、逻辑斯蒂回归和朴素贝叶斯等传统模型,本文运用的TextCNN和BiGRU模型可以有效提高准确率和AUC值。(2)基于胶囊神经网络(Capsule Neural Network,CapsNet)和BiGRU的混合文本分类模型BiGRU-CapsNet。CapsNet在图像领域具有较好的分类效果,但在文本分类领域应用较少,本文将BiGRU和CapsNet结合,提出了BiGRU-CapsNet文本分类模型,将CapsNet推广到文本分类领域。该模型同时具有BiGRU和CapsNet的优点,在BiGRU提取前向和后向文本特征的基础上丰富特征提取的角度,经实验比较后表明,BiGRU-CapsNet相对于BiGRU模型具有更好的分类性能。
其他文献
平面回波成像(Echo-planar imaging, EPI)作为一种快速成像技术,被广泛应用于灌注成像、弥散成像、功能磁共振成像、心脏成像和其他动态成像中。一幅二维图像的全部k空间数据
印度尼西亚互联网的发展始于20世纪80年代。起初,互联网的应用仅限于少数研究机构。随着印尼互联网商业化的发展,印尼网站数量和网民人数均有较大增长。但是由于印尼互联网基
本文尝试从视觉分析中国古典园林及其他同源文化现象,指出是"隐"这种中国传统景观视觉模式决定了中国古典园林的物质空间形态。本文基于后结构主义理论关于视觉的解释,把中国
山丘区小流域综合治理对防治水土流失、改善生态环境、推动区域经济发展、全面建成小康社会具有重要意义。分析了广东省山丘小流域综合治理现状及存在的问题,在此基础上,根据
目的了解养老院老年人生活满意度及影响因素。方法采用方便抽样在华都颐年园抽取110名老年人进行问卷调查。调查工具采用自设的一般情况调查表和生活满意度量表。采用SPSS11.5
传统婚俗中的吉祥图案是民俗符号体系的重要组成部分,它们承载着符号性的功能。中国有关婚礼的习俗涵化了令人目不暇接的民俗文化象征符号。这些符号集中体现为婚俗中的吉祥
新媒体艺术是指以电子媒介和光学媒介为基本语言的新艺术门类,在互联网高速发展的今天,新媒体艺术"与时俱进"的特点表现的更加明显。研究不同时期新媒体艺术的发展特征,可以
本文报导了以钛酸丁酯作催化剂,在均相条件下,由甲基丙烯酸甲酯与正丁醇进行酯交换反应合成甲基丙烯酸丁酯的新工艺。该法具有条件温和、操作简便、节约能源、产率高、质量好
进入21世纪以来,面对国际和国内社会环境的深刻变化,越南出台了一系列教育政策,着力于改革教育管理,加强师资队伍建设,扩大社会参与,普及全民教育,扶持民族教育,推进教育国际