基于Bert模型的互联网不良信息检测

来源 :电信科学 | 被引量 : 0次 | 上传用户:kxdn01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对互联网不良信息检测这一业务场景,探讨了基于网站文本内容进行检测的方法。回顾了经典的文本分析技术,重点介绍了Bert模型的关键技术特点及其两种不同用法。详细描述了利用其中的特征提取方法,进行网站不良信息检测的具体实施方案,并且与传统的TF-IDF模型以及word2vec+LSTM模型进行了对比验证,证实了这一方法的有效性。
其他文献
2020年5月17日,受如东县农林科技信息站委托,根据科技部《科学技术评定方法》有关规定,南通市农业新技术推广协会按照第三方科技成果评价标准及程序,本着科学、客观、独立、
根据热力学计算原理,以高镁磷尾矿中主要物质白云石和氟磷灰石在硫酸水溶液中的高温PHT0计算为例,研究了Mg2+-Ca2+-H2CO3-H2O、CaCO3.MgCO3-SO42--H2O、Ca2+-F--H3PO4-H2O、C
针对传统钛白废酸回收工艺存在的不足,提出了采用喷雾浓缩技术处理钛白废酸。通过实验室模拟试验并借鉴喷雾干燥技术,设计并研制了钛白废酸喷雾浓缩装置。该装置对钛白废酸的
华北陆块南缘下寒武统烃源岩的发现,为寻找华北地下能源提出了新的赋存层系,分布地区和研究领域,可望对21世纪华北勘探天然气拓展新局面有所助益,综合分析认为,华北陆块南缘具有形
常规化探方法勘查砂岩型铀矿难以奏效.应用深穿透地球化学方法系列中的元素活动态测量法在鄂尔多斯盆地砂岩型铀矿上的试验结果表明,几种U元素活动态在矿体上方都有异常出现,
新近于北天山艾维尔沟北原划为上石炭统的奇尔古斯套组火山岩系所夹灰岩中,采到了结节脊板杯珊瑚Cy-athocarinia tuberculata Soshkina,其时代属于早二叠世,表明该区奇尔古斯
自2003年启动广播电视数字化改造以来,经过10余年的发展,我国目前已经基本完成了广播电视从模拟向数字化的转换,全面进入数字电视时代。进入数字电视时代,媒体受众对电视内容
对南迦巴瓦地区雅鲁藏布江蛇绿混杂岩带内旁辛蛇绿岩中变基性岩的地球化学特征进行研究后,发现该基性岩为玻安岩,具有SiD2>53%,镁指数(Mg#)>0.6,难熔元素(Cr、Co和Ni)明显富集,