视频网站保护青少年弹幕分级算法的研究

来源 :中学生学习报 | 被引量 : 0次 | 上传用户:liuxuedong0628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:为了避免视频网站中视频弹幕对于青少年的不良影响,笔者通过使用深度学习的文字分级算法来实现用户弹幕的分层、分类、分级,对用户的弹幕进行规范引导,营造良好的网络语言生态环境。弹幕分级展示的算法需要实时更新,在数据方面需要实时扩大机器学习训练的样本,并且对语言文字的分数归类进一步的细化和精确。在技术方面可以结合心理学、传播学、统计学等学科的最新发展情况,让弹幕的分级分类更加精准。
  關键词:弹幕过滤;文本分类;弹幕分级
  1绪论
  “弹幕”是当下最为流行的在线视频实时互动交流方式,评论内容虽然转瞬即逝,但再次观看视频时还可在对应弹幕发出的节点看到该弹幕的内容,弹幕文化是一种将屏幕传播与文字传播相结合的融合文化。用户通过弹幕信息交流不仅可以与其他用户进行实时互动,使得观看视频的过程变得有趣,在交流中获得归属感[2],还可以通过弹幕了解额外的剧情知识,增强视频内容的可读性和趣味性,但由于弹幕的无限制性,用户可以随意表达自己的观点,却不用承担任何后果,促使弹幕文字有呈现低俗化的倾向,也让很多低俗语言在这种环境中进化甚至是病毒式传播。
  李欣茹学者认为,视频弹幕的流行也存在一些隐患,尤其是一些血腥暴力或者黄色内容,极易被青少年模仿,造成不良影响,因此视频弹幕的交际环境必须加以引导和净化 [1] 。郑珺、尹文汉学者认为,随着网络传播匿名环境的推进和演化,人们在弹幕的吐槽狂欢呈现出了低俗色情、暴力攻击等倾向,弹幕视频的网络表达存在失范现象。网络表达的失范现象在一定程度上给其他观看视频的用户造成了观影心理的影响,对青少年用户的健康成长也非常不利[2] 。弹幕对青少年网络社群产生影响有多方面原因,弹幕作为影响的载体与介质,依靠其媒介特征发挥作用;青少年自身猎奇、不成熟的特质使得这种影响被放大。弹幕对青少年网络社群的健康发展产生影响,如何消除影响的消极方面、增强影响的积极方面是亟待解决的问题[3]。
  基于先前学者的调查研究,以及本着保护青少年健康上网和构建绿色和谐上网环境的目的,我们可以得出结论:视频弹幕市场对弹幕分级算法是有需求的。
  2 分级算法研究
  本文主要论述了如下两部分内容。
  首先,研究数据获取,通过弹幕爬虫收集数据,针对当下流量最大的中文弹幕视频分享网站B站编写弹幕爬虫程序,爬取网站中已有弹幕进行研究。这其中包括对B站弹幕文件爬虫的编写,对于爬取的弹幕,基于分类研究的基础上进行数据标注,为之后深度学习算法的训练提供分类训练集。
  其次,弹幕分级研究,根据前面所爬取的弹幕数据,以及之前学者对于弹幕语言的研究,设置分类级别,对不同级别的用户进行弹幕分级的展示。在充分学习应用软件工程的开发方法以及编程语言、架构、数据库等知识能够解决实际问题的基础上,根据用户和管理者的需求,开发弹幕展示的分级算法。
  2.1研究数据获取
  为了本次研究的需要,笔者在开发网站爬虫时基本是针对某个网站中一类相同的文件里特定的公开内容进行爬取,与观看时进行实时摘录无异,只是从技术上起到节省时间的效果。本项目所爬取弹幕的目标为哔哩哔哩网站中的非直播的视频文件,由于B站弹幕是存在单独的XML文件中用于每次播放时的调用,所以可以爬取。
  爬虫程序所爬取的弹幕会存放在CSV文件中,表格中第一列是对每一个弹幕进行的哈希编码,第二列是每条弹幕的具体内容,第三列score是记录其分类的打分数字,当前刚爬取下来默认值设置为“-1”,便于与日后人工或者算法给出的分数进行区分。如此设计以方便未来深度学习算法作为训练集样本调用。详见下图。
  2.2弹幕分级模型
  笔者依据从B站中爬取的弹幕文件,对其中的语言文字结合先前学者的研究[1-3]进行了简单的归纳总结。大概可分为文学用语的积极词汇、日常用语的常见词汇、专业用语、对于生活的讽刺用语和经过加工躲避敏感词汇的不良言论。笔者根据百分制的原则和对这些用语的分类,对爬取的弹幕文字进行标注,最后将数据用于机器学习算法的训练。
  根据各个年龄阶段我国法律对其责任义务的规定,将弹幕分级展示的用户分为以下四个等级:6-14岁属于幼儿儿童,14-18岁属于青少年,18岁及以上属于成年人,其中如有注册用户所填年龄未满6周岁系统将不予以注册。还有一类是完全权限,是系统管理员以及应该有相应权限的监督和管理人员,可以看到系统所有用户的全部发表言论。用户弹幕分级年龄如下图2所示:
  每个等级可看到的弹幕分级分数为:
  0至不满14周岁属于幼儿儿童,可看0-40分,让处在义务教育阶段的儿童看到包括文学用语和日常用语的弹幕,更多接触健康社会,理解语言正确使用。文学用语包括正确引导儿童成长的马列主义哲学词汇,中国传统文化精髓的成语,日常用语包括生活用语甚至方言与科技以及带有拟人比喻等修辞方法的短语。
  14至不满18周岁属于青少年,可看0-60分,让处在高级中等教育的青少年在上述基础上加上动漫与游戏相关弹幕,让其有对想象世界的判断能力上进行交流,他们正在形成世界观、人生观、价值观,虽然具备了基本判别是非能力,但仍然很容易被误导。
  年满18周岁以后,世界公认此时已经是成年人,可看0-80分,可以发表对事物的看法和观点,但对成年人来说黄赌毒依然是被禁止的,所以需将这一类话语对其进行屏蔽。
  还有一类是管理员以及监督人员查看全部弹幕的权限,可看0-100分。
  3 总结与展望
  视频弹幕分级算法通过对用户年龄阶段来划分用户所能看到的弹幕类型,以此来达到保护青少年健康绿色观影和学到更多知识的目的。在开发的过程中以基础功能作为底板,对用户的发言过滤,不是随意设立“禁言”关键字,而是通过真实的数据作为支撑来实现有效过滤,让管理者只需要不断的对新兴词汇进行归纳总结评分。
  日后的研究还可以对弹幕的情感、舆论的兴起、定向引导等方面进行深入进行。分级弹幕电影系统也是在提醒网民和网络的管理者要时刻保持网络空间的绿色和谐,让更多的人意识到做和谐社会的一份子的重要性,更多的关注青少年在互联网时代的健康成长,同时我们也要在制度上为其保驾护航。
  本研究报告系国家社会科学基金项目《数据赋能的智慧媒体对青少年行为模式变化影响的研究》(项目编号:19BXW120)支持的阶段性成果。
  参考文献
  [1]李茹欣. 视频弹幕的语言学研究[D].陕西师范大学,2018.
  [2]郑珺,尹文汉.网络传播语境下弹幕视频热潮解析[J].辽东学院学报(社会科学版),2020,22(05):69-72.
  [3]陈家玮.视频弹幕基础下的青少年网络社群研究——以哔哩哔哩和斗鱼直播为例[J].视听,2020(10):134-136.
其他文献
摘要:双减政策的提出带动了教育教学工作全面改革,双减政策中的全面育人教学理念和教学服务理念,需要教师充分认知学习并理解。初中语文教学工作的开展应当认识到以往课堂教学当中存在的不足,在双减政策的精神引导下,积极主动地通过课堂教学创新策略来构建优质课堂。语文教师在初中语文教学中,要善于挖掘语文学科的人文情感色彩,培养学生的共情能力。同时要善于开展个性化教学,为不同学习背景、学习能力的学生提供相应的个性
期刊
摘要:我国的中学教师在教育教学改革的过程中逐渐转变了教学思想观念,确立了更加符合当前时代要求的教学观念,数学教学方法更加的多,课堂教学模式更加创新。教师在实践的过程中也在很大程度上提升了同学们的数学成绩,这就证明开辟创新的教学方法是可以提高初中数学的教学效率的,本文结合相关经验,对开放性教学理念进行了研究。  关键词:初中数学;开放性教学;模式探究  引言:初中数学课程中的许多内容以及知识点都和生
期刊
摘要:随着新课程教学改革的深入发展,高中历史教学越来越受到重视,教学要求也逐步提高,更加注重对学生学科素养的培养。作为历史学科素养中的重要内容,家国情怀的培育是必不可少的教学内容。在高中历史教学中对学生进行家国情怀的培育,也是学生德育教育的重要方式之一。本文阐述了高中历史教学中培育学生家国情怀的基本内涵以及重要价值,重点分析了高中历史教学中培育学生家国情怀的主要策略,希望对高中历史教学的发展提供借
期刊
摘要:学生学习的不同阶段对于不同学科来说侧重点也各不相同,小学阶段对于学生的数学学习来说,更要全面的训练学生计算,通过扎实掌握计算技巧解决各类数学问题,提高自己的解题能力,以便于日后中学深入学习更多数学知识。本文便基于当前对小学数学的教学现状和计算能力培养问题,从不同角度探究能够提高小学高段学生数学计算能力的有效措施。  关键词:小学数学;高段学生;计算能力  引言:在生活中随处可见计算能力的应用
期刊
摘要:英语是世界的通用语言,为了适应全球化的发展,英语学科的学习就成为了中国课堂教育中十分重要的学科。听、说、读、写是学习一门外语必备的四个过程,其中,英语阅读在英语学习中更是处于举足轻重的位置,初中英语是英语学习的基础阶段,经历学前以及小学阶段的入门学习,学生们的阅读能力也有了不同的程度的掌握,为了满足课程教育,提高学习效率及效果,英语教学方式也要有所创新。  关键字:初中英语;英语阅读;分层教
期刊
摘要:地理包含千姿百态,是一门寓教于学的学科。《新课标》中强调,高中地理的知识教学,要从理论知识体系和实践活动双管齐下,全面提高学生的综合素质,就此而言,高中物理如仅仅局限于书本的理论知识,过于枯燥难懂,也违背了地理教学的初衷。由此看来,在高中地理教学中,加强培养学生的实践能力,对提高学生对高中物理的学习兴趣是有很大帮助的。  关键词:高中地理;教学方法;实践能力  引言:地理是一门注重实践的学科
期刊
摘要:本文主要叙述了人工智能在家装行业以及旅游行业中的应用。旨在为人工智能技术在各行各业中的发展提供帮助。  关键词:人工智能;家装行业;旅游行业  一、引言  随着现代化信息技术的快速发展,各种各样的新技术、新设备已经应用在人们的生产、生活和学习当中。目前人们广泛使用的主要的现代科学技术,包括大数据技术、云计算技术、移动信息技术等等,而随着这些新技术的快速发展,又有一项新的技术,新科技已经展现在
期刊
摘要:针对于许多小学四年级的学生来说,数学和英语是比较难理解和掌握的。特别是学生对数学的理解和掌握达不到规定的教学目标水平,导致许多学生在数学学科时过于困难。而小学数学困难的形成有许多因素,例如家庭、学校与自身因素,并且根据学生之间的性格差异与学习态度,都会间接的使学生变成“学困生”。基于此,本文从“学困生的概念与界定”出发,研究小学四年级数学学困生的形成原因,并提出转化“学困生”的有效对策,以供
期刊
摘要:初中的语文阅读教学最看重的就是教学的教学设计,如果一个教师的教学设计完美,那么这一节语文閱读课程就能够让学生收获到更多有用高效的知识。所以初中语文教师要极其重视语文阅读教学的规划,这样才能对语文课堂的情况有所了解,提升自身的教学手段,让学生能够运用更加便利、有效的教学方式学习语文阅读。  关键词:初中语文;阅读教学;规划方法  引言:在初中的语文阅读教学中,提升学生的阅读能力和水平,让学生多
期刊
摘要:审计是以独立第三方形式存在的经济监督、确认和鉴证活动,其始终肩负着社会经济活动监督的重要使命。不容忽视的是,仅将课程思政任务交付于思想政治理论课,会导致大学生德育教育与专业知识学习出现割裂、断层的情况。基于此,如何将专业知识与德育教育有效融合,在审计学课程中兼顾“授人以渔”与“授人以德”,以审计工作开展为主线构建思政教育体系,探索思政教学内容与路径,以充分发挥审计学课程德育功能具有重要的现实
期刊