基于深度学习的蒙古文微博情感分析研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:ywbll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会媒体的发展,越来越多的用户通过微博来表达情感。因此,对微博中的情感进行挖掘有很大的应用价值。近年来,深度学习的技术在自然语言处理领域中取得了广泛的应用。所以本文将基于深度学习对蒙古文微博情感分析进行研究,具体工作内容总结如下:(1)由于蒙古文语料匮乏,本文构建了蒙古文微博情感分析语料库,选用NLPCC2014部分中文语料作为原始语料。由于原始语料包含大量噪音,需要对原始语料预处理。将清洗后的原始语料进行汉蒙机器翻译,并对翻译后的蒙古文语料进行人工校正。最终构建得到蒙古文微博情感分析语料库。(2)针对蒙古文微博主观识别任务,本文提出一种使用多头自注意力机制结合双向长短期记忆网络的情感分析模型(MA-BLSTM)对文本进行特征提取。然后,通过相关实验找到模型最优超参数,并验证了本文提出的MA-BLSTM模型在蒙古文微博数据集上的性能优于其他基线模型。(3)对于蒙古文微博情感倾向判断任务,本文采用Transformer结合卷积神经网络的集成模型(TCNN)来判断蒙古文微博的情感倾向。通过实验确定让模型达到最优性能时编码器的个数,卷积核的数量及大小。最后,验证了本文提出的TCNN模型的效果相比于其他基线模型在蒙古文微博情感分析数据集上表现最好。(4)针对蒙古文微博文本,本文开发了B/S结构的情感分析系统。系统的功能有:一键分析、主观识别及情感倾向判断等功能。同时,为了扩充数据集,将每次情感分析后的语料及结果保存起来,方便后续对模型的更新和迭代。
其他文献
随着移动互联网不断成熟和中国人口老龄化进程的不断加剧,越来越多的老年人参与到了移动互联网发展的浪潮之中。凭借着低门槛和去中心化的互联网场域,老年群体可以利用各种媒介来表达自我、展现自我。同时,他们也在互联网掀起了一股“老年网红”的热潮。健康的老年生活需要老年人参与到社会活动之中,作为数字化时代的弱势群体,“老年网红”的崛起让社会以及公众看到了老年人融入互联网的可能性。本文从传播学的视角出发,研究“
Vlog作为一种短视频,2018年逐渐流行于我国各大视频网站,成为众多原创视频制作者选择记录分享生活、传播信息的新方式。央视等主流媒体也在Vlog短视频的潮流下,将新闻与短视频融合,进行了诸多内容与形式上的创新。这种传播方式的转变,使新闻报道中严肃的话语模式变得有温度、接地气,受到广大年轻群众的喜爱。同时,Vlog新闻在实践方面存在的不足也受到一些学者和新闻工作者的重视,并深入研究。本文主要运用的
习近平总书记指出:“当今世界是开放的世界,当今中国是开放的中国。”21世纪,各国之间的联系越来越密切,日益成为一个利益共享、职责共担的命运共同体。我们关注的眼光不仅仅局限于眼前,也要把握更加宽广的国际视野。2020年,新冠肺炎疫情大爆发,人民面对新冠病毒的挑战,消极情绪容易滋生和蔓延,情绪传播更需要一个“积极情绪”的引导,人们的报道关注焦点集中在新冠疫情的信息上来。社交媒体在重大公共卫生事件报道中
21世纪以来,工业化和城市化的发展,人口的大量激增,垃圾产量每年可达到亿吨以上,生态环境问题逐渐突出。严重的环境污染影响着国家的进步和发展,阻碍着人民的生活水平的提高,垃圾治理问题关系着改善我国城乡居民的生存居住环境。如何处理巨大的垃圾产量,已经成为解决环境问题重要的一部分。生活质量的不断提高,垃圾治理问题逐渐成为热议,有关垃圾处理问题的报道开始受到社会不同阶层的关注,影响着受众的观念意识,在改变
国防和军队的现代化与军队组织形态的现代化息息相关。党的十八大以来,我国将军队文职制度改革纳入军队人力资源改革之中。当前,随着国防和军队改革的不断深入,我国正处于军队现代化建设的关键时期,加上不断改进的军队文职人员制度,大批优秀人才涌入军营,活跃在国防和军队建设的各个领域,承担着教学科研等重要任务。党的十九大后,文职人员制度改革继续深化,2017年重新修订的《中国人民解放军文职人员条例》,标志着我军
“两会”报道作为我国具有代表性的重大主题新闻报道,关乎着新时代条件下媒体对党的路线、方针和政策的宣传引导,也关系着媒体能否拉近同新闻用户之间的距离,实现与用户的良性互动。数据新闻的可视化便为“两会”重大主题新闻报道提供了一种新的发展思路。本文在扎实梳理文献的基础上从数据新闻可视化的基本理论入手,区分相关概念,解释数据新闻可视化的定义,厘清数据新闻可视化的类型,阐述重大主题数据新闻可视化的生产流程。
美是人类永恒的追求,随着社会经济发展,生活水平提高,人们更加注重精神享受,对艺术和美的需求也体现在生活的方方面面,生活美学应运而生,它强调审美平民化以及艺术生活化,其研究对象就是活生生的生活。对于生活美学的体现与传播,短视频作为新型的艺术载体,无疑发挥了重要作用。据中国互联网络信息中心(CNNIC)最新发布的第47次《中国互联网络发展状况统计报告》显示,截至2020年12月,我国短视频用户规模为8
人脸信息被用于各种验证场所,主要是因为相比于其他认证手段,人脸信息具有唯一性、实时性和难伪造性。跟机场、火车站等一些大型场所相比,住宅小区的住户容量较小,住户信息较稳定,可以更充分发挥人脸识别技术的优势。本文设计了一种基于卷积神经网络的人脸识别门禁系统,实现无接触、快速的门禁检测。本文主要对人脸检测、活体检测、人脸特征提取和对比等方面进行了学习与研究。采用核相关滤波算法(Kernel Correl
奶牛采食行为是奶牛活动的关键行为之一,反映奶牛的健康状态与饲喂情况等。传统人工的观测只针对个人牧场,而规模化牧场只依靠人工成本较高。近几年来,随着数字化技术与人工智能的不断发展,可穿戴设备运用在了各个领域中。畜牧业中运用该方法可降低人工与资金成本,增加效率,减小损失。基于此,本文提出了一种基于活动量数据与深度学习的方法对奶牛采食行为进行识别研究,通过采集活动量数据加以分析处理并运用深度学习等算法模
在信息爆炸的当下,挖掘有效信息成为巨大挑战,新闻媒体正是大众获取信息的重要渠道之一。而新闻文本分类、倾向性分析可适用于新闻线索收集、舆情监控、决策辅助、有害信息过滤、运营分析、专题分析及新闻推送等领域,能够有效帮助用户快速、准确地获取所需信息,帮助新闻媒体在茫茫数据中分析出规律和关联项,达到便捷快速处理新闻的目的。文本分类及情感倾向性分析目前在国内外研究较多,发展相对成熟,但是蒙古文相关研究的起步