【摘 要】
:
随着大数据时代的来临,社会中的各类数据正以极快的速度增长,而文本数据的挖掘是一个急需解决的问题。其中文本分类技术又是所有文本挖掘技术的基础所在,故如何对文本数据进
论文部分内容阅读
随着大数据时代的来临,社会中的各类数据正以极快的速度增长,而文本数据的挖掘是一个急需解决的问题。其中文本分类技术又是所有文本挖掘技术的基础所在,故如何对文本数据进行自动分类是一个值得研究的技术方向。基于深度学习中的循环神经网络模型(RNN)来对文本数据进行挖掘,可以解决统计学习方法进行文本分类上忽略上下文信息的弊端,将是以后研究相关领域的经典范例。论文首先介绍了文本分类过程的概述,并对分类过程中的每一个步骤进行了详细的分析,就文本表示模型中主要介绍了文本表示模型中的向量空间模型(VSM),就分类器的选择中主要介绍了支持向量机的原理和思想。针对统计学习方法进行文本分类的缺点,提出了利用神经网络模型来进行文本分类,有效的解决了统计学习方法没有利用上下文信息等缺点。因此引出了新的神经网络模型—循环神经网络模型(RNN),并推导了循环神经网络的训练算法BPTT算法。最后的实验结果也表明了采用循环神经网络模型的分类系统相比统计学习方法的分类系统上在准确率与召回率上都有显著的提高。
其他文献
为确保官地水电站地下厂房岩壁吊车梁结构的安全性,需对吊车梁裂缝进行检查、处理。详细介绍了裂缝的处理措施,包括化学灌浆和碳纤维加固的材料选用、施工程序、施工方法,并
论文借鉴前人的经验,尝试将个体社会经济地位、家庭特征、村庄特征和非正式社会支持这四个潜变量纳入到中年农民养老模式选择意愿的结构方程模型中,定量地考察这四个因素对中
新农保制度的出台,不但完善了我国的农村社会养老保障体系,而且对于改善农村居民的生活水平和促进农村居民的消费具有重要意义。本文主要立足于安徽省,分别从政策层面和实证
2004年的"特纳奖"评选中,杜尚的《泉》一举击败毕加索的《亚威农少女》和安迪·沃霍尔的《玛丽莲·梦露》,成为二十世纪最具影响力的作品。于是,被奉为艺术品的小便池便成为
《医学与哲学》1998年第3期刊登了毋光明等同志的一篇题为《从西方释义学角度探究肿瘤定义》的文章(以下简称定义一文)。定义一文用西方释义学对现有的一些肿瘤定义进行理论上的探索
[目的]评价斜外侧椎间融合术(oblique lateral interbody fusion,OLIF)联合后路固定治疗腰椎退变性疾病的近期疗效。[方法]回顾性分析本院2016年1月~2016年7月行OLIF联合后路
词汇的使用有时会"创造性地"突破其惯有的语法属性限制,在新的句法环境中获得新用法。现有文献主要从纯句法理论视角对相关创新用法加以阐释,但对相关语言现象产生的外部动因
<正>实现国有企业治理体系和治理能力现代化,要狠抓四个方面的工作。必须完善国有企业治理现代化的法律体系法律是治企之重器,良法是善治之前提。贯彻三中全会、四中全会精神
锦屏一级大坝工程施工布置紧凑、施工场地狭小、施工条件差,但大坝混凝土施工质量要求高,施工安全风险大。大坝混凝土浇筑期间可能遭遇的突发事件较多,必须提前规划和落实混