基于BERT的不完全数据情感分类

来源 :计算机应用 | 被引量 : 1次 | 上传用户:xcn1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不完全数据,如社交平台的互动信息、互联网电影资料库中的影评内容,广泛存在于现实生活中。而现有情感分类模型大多建立在完整的数据集上,没有考虑不完整数据对分类性能的影响。针对上述问题提出基于BERT的栈式降噪神经网络模型,用于面向不完全数据的情感分类。该模型由栈式降噪自编码器(SDAE)和BERT两部分组成。首先将经词嵌入处理的不完全数据输入到SDAE中进行去噪训练,以提取深层特征来重构缺失词和错误词的特征表示;接着将所得输出传入BERT预训练模型中进行精化以进一步改进词的特征向量表示。在两个常用的情感
其他文献
【第四章悄然袭来的睿智】异变之后大约一个月,琪雅的记忆没有任何恢复的迹象,游击士协会方面也没有传来任何有用的消息。某天,诺艾尔上士打来电话,说是有私人的请求要委托我
在这款射击游戏中,机器人福瑞德被囚禁在一座太空电站中。为了逃出这里,福瑞德自己搭建了袖珍实验室,并制造出了具有强大攻击能力的悬浮战车。接下来,就由你来控制这辆强力悬
安卓4.0系统又被爱称为"冰激凌",在推出之前就已经备受众追随者推崇,终于,它如王者般降临了!Rock Panda一直很想尝试一下这个全新的操作系统,苦于自己的爱疯4还安详地躺在桌子
综述了通过多种合成/制备策略得到不同尺寸、不同形貌、不同维度的金属硫化物,以及其与石墨烯/碳纳米管等复合材料,包括层状、三明治、中空核壳状及其混合结构等形式的金属硫
“赛尔号2”中什么精灵人气最高?这似乎是一个很难回答的问题。但如果问“赛尔号2”中什么精灵最多变?答案只有一个:伊特!玩过赛尔号的淀粉都知道。
搜索引擎作为互联网主要应用之一,能够根据用户需求从互联网资源中检索并返回有效信息。然而,得到的返回列表往往包含广告和失效网页等噪声信息,而这些信息会干扰用户的检索与查询。针对复杂的网页结构特征和丰富的语义信息,提出了一种基于注意力机制和集成学习的网页黑名单判别方法,并采用本方法构建了一种基于集成学习和注意力机制的卷积神经网络(EACNN)模型来过滤无用的网页。首先,根据网页上不同种类的HTML标签
最后给大家带来的是一款海盗题材的消除类小游戏。游戏中玩家将跟随海盗船长展开一段有趣的冒险之旅,通过自己的努力,最终获得属于自己的“神秘之地”。好了,出发吧!
Under natural conditions, plants constantly encounter various biotic and abiotic factors, which can potentially restrict plant growth and development and even l
近年来,超临界流体萃取在我国发展极其迅速,应用领域越来越广。本文就超,临界CO2萃取的基本原理、超监界CO2取天然香辛料精油的工艺、夹带剂的选择与使用、精油组分的分析方法和
农业植物病理学是农业高校植物保护专业的核心课程。为适应现代社会对具有创新意识及实践能力植保专业人才的需求,利用MOOC、SPOC课堂对农业植物病理学课程的教学内容、教学模式及考核方式进行了系列改革。通过这些改革,培养学生获得、掌握、运用知识的能力及提供更多实践技能训练的机会,为将来学生走入社会运用植保专业理论知识及实践技能解决生产问题打下坚实基础,使人才培养能力及培养水平跃升新台阶。