【摘 要】
:
计算机技术的发展加速了信息化时代的进程,同时也造成数据的指数型增长和数据处理工作量的增加。为了更高效地处理文本数据,自然语言处理及其相关研究被广泛关注。文本分类作为自然语言处理的子任务,在多个领域有着非常广泛的应用,如新闻分类、数字图书馆、情绪分析以及垃圾邮件过滤等。从目前的相关研究来看,在保证分类器能够充分训练的前提下,基于深度神经网络的文本分类方法已明显优于基于传统机器学习的文本分类方法。因此
论文部分内容阅读
计算机技术的发展加速了信息化时代的进程,同时也造成数据的指数型增长和数据处理工作量的增加。为了更高效地处理文本数据,自然语言处理及其相关研究被广泛关注。文本分类作为自然语言处理的子任务,在多个领域有着非常广泛的应用,如新闻分类、数字图书馆、情绪分析以及垃圾邮件过滤等。从目前的相关研究来看,在保证分类器能够充分训练的前提下,基于深度神经网络的文本分类方法已明显优于基于传统机器学习的文本分类方法。因此,深度神经网络的结构和应用将会是文本分类性能提升的重要途径和文本分类领域的主要研究方向。文本分类的效果不仅取决于分类器的设置,如何构造文本特征也尤为重要。对于离散的文本数据,构造特定的、可解释的语言模型来获取文本的嵌入表示,通过改进特征嵌入表示方法可以提高文本量化的质量,是间接提高分类器性能的有效方法。在文本分类领域中,现有的文本分类方法均通过结合文本量化方法和文本分类器取得了优异的性能,所以改进特征嵌入表示方法并将其与深度神经网络相结合是提高文本分类性能的有效方式。本文通过对文本分类应用和过程的分析,具体阐述了研究基于特征嵌入表示的文本分类方法的意义,具体研究内容如下:(1)提出一种结合动态语义表示模型和深度神经网络(DSRM-DNN)的多标签文本分类方法。利用词嵌入模型和聚类算法来选择语义词,将被选择的语义词作为DSRM-DNN的基本元素,通过词属性的加权组合进行量化。将深度信念网络与反向传播神经网络相结合构造文本分类器,使低频词和新词在稀疏约束下用现有的语义词重新表达。在RCV1-v2、Reuters21578、EUR-Lex和Bookmarks等数据集的实验结果表明DSRM-DNN方法优于比较方法。(2)提出一个结合字符级卷积神经网络和生成对抗网络的文本分类框架(CCNNGAN)。利用字符级卷积神经网络对文本进行量化,将文本特征分别输入到对抗网络和分类器中。在数据扩充模块中,利用处理后的真实数据对生成器和判别器进行训练,使生成分布与真实数据分布不断吻合。分类器通过真实数据和生成数据进行协同增量训练,这样既解决了小样本的问题,又减少了文本生成的计算消耗。通过在四个公开数据集上的大量实验证明CCNN-GAN方法明显优于比较方法。
其他文献
随着高分子科学的迅猛发展,高分子材料被广泛地应用于社会的各行各业,给人们的生活带来了极大的便利,同时相关的塑料废弃物也因为处理方法有限和二次污染严重等问题对环境造
随着社会的发展和科学技术的进步,互联网涌现出大量的社交平台,使得网络用户的信息传播更加便利。在信息传播速度快、数据量庞大的社交网络中,推荐系统可以有效预测用户所需的信息,向用户提供帮助。但是在推荐系统中,相比于海量的数据信息,用户所接触到的信息是非常少的,面临着信息数据稀疏化的问题,在一定程度上不利于用户之间的相互推荐,导致推荐的精准度不高,用户的体验变差。因此,如何有效的解决稀疏性问题是目前社交
信息交替的快速发展时代,图像作为主要的传播学信息载体被适用于各个被公众熟知且必需的场景,如医疗军事领域、卫星监测领域、数字媒体等众多领域都对图像质量提出了更高的要求。一般的低分辨率图像难以被大众接受,人们需要更丰富更多彩的图像来满足视觉上的享受。因此,图像处理和计算机视觉领域成为超分辨率(Super-Resolution,SR)重建技术的重要应用范畴。近些年来,深度学习技术在众多领域获得突破性进展
当今社会的一个显著特征就是市场在资源配置中起决定性作用。因此,大学生思想政治教育要想达到更好的育人效果,就要适应社会发展的新特点,适应当代大学生群体的新需求,积极进行探索、改革和创新。同时,注重调动大学生的主体性作用,灌输与启发相结合,是大学生思想政治教育适应时代变化发展的必然要求。通过培育大学生思想政治教育品牌,进而提高大学生思想政治教育质量与水平,增强思想政治教育对大学生的影响力和亲和力。本文
自党的十八大以来,司法责任制改革正在稳步推进,其核心要义和科学内涵在于“让审理者裁判,由裁判者负责”。“让审理者裁判”解决的是审判权运行秩序紊乱的问题,“由裁判者负
金属/碳复合材料是一种新型的复合材料,其具有成本低廉、高催化活性、稳定性强和催化寿命长等特点,是替代贵金属催化剂的选择之一。金属/碳复合材料是将过渡金属与碳相结合,
在我国发展进入新时代、慈善事业进入快速增长期,慈善基金会数量迅速增加,新慈善业态不断涌现的背景下,本论文的研究对完善社会保障体系、促进和谐社会和美丽中国的建设具有
随着社会经济的快速发展,企业间的竞争越来越激烈,企业间竞争的重心逐渐转移到技术创新上的竞争,而研发则是实现技术创新的重要途径。单个企业在研发的过程中存在着研发难度大和研发风险高等问题,合作研发有助于降低企业的研发难度和研发风险,并增加企业的研发收益。企业在研发过程中也会受到市场权力结构的影响,占主导权的企业会利用权力来控制其他企业的决策。本文针对单一供应商、单一制造商和策略型消费者组成的供应链,考
《刑法修正案(九)》的出台扩大了罚金刑的适用,罚金刑与没收财产刑之间的竞合进一步扩大,致使在司法实践中当一人犯一罪时,罚金刑与没收财产刑进一步出现失调的现象。同时,在2011年《刑法修正案(八)》出台后,罚金刑与没收财产刑在一人犯数罪进行数罪并罚的的情形下,是应该按照司法解释与司法习惯的做法只执行没收全部财产刑,还是按照《刑法修正案(八)》的规定进行分别执行,学界存在着争议。面对一人犯一罪时和一人
随着三维电视(Three Dimensional Television,3DTV)、三维(Three Dimensional,3D)电影越来越广泛地进入到人们的生活,高质量的视觉感受可为消费者提供充分的精神给养,因此人们对图像和视频的视觉质量要求越来越高。3DTV系统需要同时输入来自同一个场景的二维(Two Dimensional,2D)彩色视频和2D深度数据。其中,深度数据可说明场景的位置,借助