【摘 要】
:
网络在线视频已经在人们观看视频过程中占据重要地位,成为大众视频消费的主流。“弹幕”因其高互动性和娱乐性开始进入人们的视野,弹幕是指用户在视频网站上观看视频时,可以直接将评论发送并显示在屏幕上方的一种显示方式。如今,国内弹幕应用虽然火爆,但是国内弹幕文化和技术的整体发展时间较短,当前针对弹幕的研究还相对匮乏。随着深度学习技术的不断发展,基于神经网络的垃圾弹幕识别模型被证明具有独特的优势。本文在总结研
论文部分内容阅读
网络在线视频已经在人们观看视频过程中占据重要地位,成为大众视频消费的主流。“弹幕”因其高互动性和娱乐性开始进入人们的视野,弹幕是指用户在视频网站上观看视频时,可以直接将评论发送并显示在屏幕上方的一种显示方式。如今,国内弹幕应用虽然火爆,但是国内弹幕文化和技术的整体发展时间较短,当前针对弹幕的研究还相对匮乏。随着深度学习技术的不断发展,基于神经网络的垃圾弹幕识别模型被证明具有独特的优势。本文在总结研究传统的分类模型与词向量模型的基础上,探讨对垃圾弹幕文本的识别,针对弹幕独有的特征,构建BERT-DPCNN模型来改进垃圾弹幕的识别方法。本文使用DPCNN作为垃圾弹幕识别模型,以获取更多层次的信息,并在该模型的基础上进行改进,将BERT模型训练得到的文本向量作为改进的DPCNN模型的输入,然后在模型中引入批标准化,构建的BERT-DPCNN垃圾弹幕识别模型,不仅能够提取更多的信息,而且尽可能地避免了深层神经网络梯度消失的问题。本文分别采用电视剧、电影、综艺及直播四个类别的弹幕数据作为数据来源进行试验分析,以验证本文提出模型的表现效果。获取样本集之后,使用BERT-DPCNN模型来对垃圾弹幕进行识别,同时与Text CNN、Bi LSTM、Bi LSTM-Attention和基于word2vec词向量的DPCNN模型进行对比,可以看出,本文提出的改进模型能够理解更多的语义,根据模型的召回率、精准率和F1指标可得,BERT-DPCNN模型在这三个指标上均为最高,能更有效地识别垃圾弹幕。并且,从实验数据中可以看出,涉及到深度模型的一些特征提取方法如本文的BERT模型,相比于基于word2vec的特征提取方法,能够表现出更加明显的优势。本文构建的BERT-DPCNN模型能够存储更多的语义环境信息,为文本分类提供更多的依据,也能够提取出更加深层次的文本特征,是综合表现最优的模型,对于垃圾弹幕的识别具有重要的价值。
其他文献
原青海省民族事务委员会、青海省宗教局助理巡视员,青海土族研究会常务副会长,《中国土族》杂志副总编辑董思源同志因病于2009年7月17日在互助逝世,享年74岁。
目的:探讨拇指爪形指形成的原因及治疗方法。方法总结16例由于正中、尺神经损伤导致拇指爪形指的成因并采用外在肌移位加关节囊及韧带修复,单纯关节囊韧带修补,拇掌指关节融合术
三川是一块美丽而神奇的土地,雄伟的凤凰山用巨大的翅膀护卫着这块土地,滔滔的黄河水千百年来用甘甜的乳汁滋润着这块土地。这里是彩虹的故乡,这里是"道拉"的摇篮。这里是唐
目的 探讨循证护理在股前外侧皮瓣游离移植修复小腿及足部软组织缺损术中配合的应用效果.方法 对2014年5月-2015年7月的80例股前外侧皮瓣游离移植修复小腿及足部软组织缺损手
上联龙离大海飞来,永住偎依恋三川.况弹丸之地扼关嗌(1)、通五县、接甘青、控丝路,险堑雄关军士兵家争夺也!暴风骤雨洗礼三川,常演触目惊心悲剧.此处西倚积石岿岭,东与永靖娅
6月30日,碧空如洗,大通回族土族自治县20华诞如期而至。县体育广场上,各族群众组成的方阵整齐划一,军乐嘹亮,彩旗飘扬,太阳映红了在场数万人的笑颜,奋进中的大通分外妖娆。
目的:探讨损伤动脉残端的病理变化,为皮瓣移植供血动脉的选择提供组织学依据。方法2007年1月-2012年2月,对15例外伤性胫前、胫后动脉及尺桡动脉损伤或缺损的动脉残端做病理取材,
用原位聚合法在凹凸棒土(ATP)的表面包覆上5-磺基水杨酸(SSA)掺杂的聚苯胺(PANI),合成了SSA-PANI/ATP纳米复合材料,研究了SSA掺杂量、聚合温度、苯胺包覆率、聚合时间和过硫酸铵(APS
目的 探讨克氏针顺行弹性髓内固定治疗第2,3,4跖骨干、跖骨颈骨折的疗效.方法 2012年5月-2015年7月,对9例13处明显移位的第2,3,4跖骨干、跖骨颈骨折患者,骨折端闭合复位,采用
目的:研究发现氧化三甲胺(Trimethylamine-N-oxide,TMAO)水平与冠心病发病机制密切相关,调控肠道菌群及代谢物有望成为心血管疾病治疗的新靶点。本研究探讨急性冠状动脉综合