基于深度学习的网络言论毒性检测研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:hezhimou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着互联网平台的开放,各个平台为了提高其与用户的黏性,都开通了相应的社交渠道,广大用户可以自由地发表个人意见和观点。然而,一些用户利用互联网平台的跨时空性和透明性等特点,违反网络平台管理条例,肆意发表不利于国家稳定发展、社会安定团结、有损他人身心健康的毒性言论,对社会造成了不良影响。网络言论毒性识别对提升用户体验、网络环境净化和促进国家社会的健康发展具有重要意义。为了有效解决毒性言论在网上肆虐以及没有相应措施管理的严峻情况,本文提出了基于深度学习的网络言论毒性检测模型BLAM来识别网络毒性言论。本文的研究工作有以下几方面:(1)BERT毒性场景有监督预训练。毒性言论属于短文本,本实验数据集中文本最长为220个字。在特征与主题极不明显且字符数很短的情况下如何充分利用其信息,最大程度地识别出短文本的毒性言论,首先需要解决的是短文本的表征问题,通过应用本文的实验数据集对BERT预训练模型进行再训练,得到毒性场景的BERT训练模型。(2)基于深度学习构建网络言论毒性检测模型。本文在毒性场景BERT训练基础上,通过双向长短期记忆网络基(Bi_LSTM)、自注意力机制(Self-Attent ion)和全局最大池化层(Max-Pooling)融合构建深度神经网络模型BLAM以达到对毒性言论的识别。(3)减少身份信息带来的意外偏差。本文应用多任务共享机制,研究了不同任务和不同共享机制下模型的偏差。最后确定使用身份识别任务与毒性言论检测任务在层次共享机制下训练的模型,检测提及身份的毒性言论上的偏差最低。本文提出的基于深度学习的毒性网络言论检测模型BLAM在毒性检测任务上Recall为88%,AUC值为95%,实验结果验证了模型的有效性。
其他文献
大规模MIMO系统作为5G移动通信系统中的一项关键技术,其性能依赖于精确的DOA估计。大多数广泛应用的DOA估计算法都是假设信源信号模型为点信源。然而相比于点信源,非相干分布式信源信号模型更适合实际通信环境。因此本文对大规模MIMO系统中非相干分布式信源的DOA估计算法进行研究。由于庞大的天线数量导致阵列接收到的信号的协方差矩阵的维数增加,进而增加了特征分解的计算负担,因此高精度的子空间类算法在大
本论文以声乐专业硕士研究生音乐会设计与演唱实践为研究对象,深入研究了设计独唱音乐会应注意的问题以及音乐会实践的重要性。本论文主要从三个方面展开论述:一、声乐专业硕士研究生应该具备独立设计独唱音乐会的能力。首先要拟定音乐会演唱曲目,演唱曲目既是水平的体现,也是能力的展示,所以,编排要以自身能力水平为出发点。其次音乐会前要与艺术指导主动合乐,听取艺术指导的教导。还有就是要做好演出前的舞台彩排。二、草原
随着5G的快速普及和人工智能产业的迅猛发展,无人驾驶技术已经成为新兴的热门研究方向,而车辆检测与跟踪是当前无人驾驶领域中重要的研究热点之一。由于真实的道路场景复杂多变和遮挡等干扰因素的存在,车辆检测与跟踪算法的研究面临着严峻的挑战,如何能实现对车辆快速精准的检测及跟踪是迫切需要解决的技术难题。本文对基于深度学习的车辆检测与跟踪算法进行了研究。主要工作内容如下:在车辆检测方面,首先对当前广泛应用的目
随着第五代移动通信的商用化以及第六代移动通信的发展,为了进一步应对移动用户数量及其相应的无线数据流量指数增长的需求,由于毫米波大规模MIMO技术可以提供更大的带宽和更高的频谱效率,从而将可实现的数据速率性能显著提升到每秒多千兆比特的水平,因此被认为是最具有前景的技术之一。随着基站天线数和用户数呈密集式增长,系统的无线资源会变得相对有限,资源的不合理分配会对毫米波大规模MIMO系统性能造成影响并带来
现如今,机器学习、人工智能等技术逐步与畜牧业相结合,推动了智慧畜牧业的高速发展。在智慧畜牧业领域中,针对奶牛等反刍动物的研究尤为广泛。反刍时长可以反映出反刍动物的健康状况。因此,如果能实现对奶牛反刍行为的识别检测,就能及时发现反刍异常的奶牛,让患病的奶牛及时得到治疗,避免牧场的损失。本文针对音频数据、视频数据等类型的数据具有的提取困难、噪声多、模型对其识别结果不理想等问题,基于奶牛的活动量数据和神
如今,无线传感器网络(Wireless Sensor Networks,WSNs)引起了全世界的关注,并被大范围的应用在各个领域,例如医疗护理、情报探测、军事行动和空间探索等。其中,时钟同步技术是关键的支撑技术之一。因为每个传感器节点只有运行在统一的时间基准上,采集到的信息才有价值。然而,WSN中由微型电池提供所需要的能量,这往往会出现能量不足的问题以及存储能力、处理和计算资源有限等问题,给时钟同
近年来,物联网(Internet of Things,Io T)技术发展迅速,同时也带动了其他产业的发展。无线传感器网络(Wireless Sensor Networks,WSN)作为Io T的底层技术支持,凭借着其低成本、易部署以及广泛的应用场景等特点成为了一个热门的研究领域。而WSN的节点能量有限且无法对电池补充能源,导致WSN的生命周期有限。所以如何提高节点的使用时间,延长网络的使用寿命就成
随着城市建设的快速发展,许多高层建筑应运而生,原来的城市供水已不能满足高层居民的用水需求,因此二次供水系统已成为必不可少的设施。二次供水系统是城市供水管网系统的重要环节,是保证城市高层住宅正常供水的优势,体现在很多方面。许多早期的二次供水系统的供水性能存在严重问题,包括高层建筑设计设施老化,系统设计不良,管理不到位等一系列问题,对高层住宅水质造成严重影响,给整个城市的供水系统带来了巨大的隐患。因此
社交网络的普及使得垃圾邮件发送者在平台上无处不在,一是垃圾邮件挤占了网络有限的硬件资源和信息传输渠道,影响了网络有效信息传播的效率,严重降低了用户体验;二是垃圾邮件还会对合法用户构成多重安全风险。社交网络平台通过技术手段对垃圾邮件发送者进行过滤,然而,互动形式多样化和用户关系多维化都使得有效检测垃圾邮件发送者的难度加大。本文提出一种基于图神经网络(Graph Neural Network,GNN)