【摘 要】
:
随着网络媒体的飞速发展,网民们利用网络不断沟通交流,使得网络语言也迅速发展起来,逐渐成为了人们不可缺少的一部分,也成为了研究者们研究的对象。不可否认的是,网络语言的发展极大地丰富了汉语言的表达,促进了汉语语言文字的发展,但同时也应当注意到,网络语言中充斥着一些不规范、不和谐、不健康的内容,例如,网络语言中的错别字、语言暴力、侮辱、色情等问题。因此,如何正确地分析网络语言中存在的问题,并及时检测、跟
论文部分内容阅读
随着网络媒体的飞速发展,网民们利用网络不断沟通交流,使得网络语言也迅速发展起来,逐渐成为了人们不可缺少的一部分,也成为了研究者们研究的对象。不可否认的是,网络语言的发展极大地丰富了汉语言的表达,促进了汉语语言文字的发展,但同时也应当注意到,网络语言中充斥着一些不规范、不和谐、不健康的内容,例如,网络语言中的错别字、语言暴力、侮辱、色情等问题。因此,如何正确地分析网络语言中存在的问题,并及时检测、跟踪网络语言问题成为了一个重要的现实问题,同时给网络媒体语言的研究者带来了新挑战和新课题。随着人工智能的不断发展,现今很多领域都取得了突破。在2016年AlphaGo正式在公众上亮相,它先后在围棋比赛中战胜世界冠军李世石和柯洁,从而轰动世界,获得人们的广泛关注。AlphaGo的出现也使得人工智能的技术获得世界的关注,让人工智能研究成为焦点。它主要由两个神经网络构成,一个是策略网络,另一个是价值网络,这两个“大脑”合作来改进下棋。本文受AlphaGo策略思想的启发,为净化网络环境对不良词汇进行识别与分类研究。基于这一研究主题,本文的主要工作有以下几点:(1)研究文本分词方法,不良词汇的识别的首要工作是要将所要研究的句子进行分词,词才是本文研究的对象,得到一个一个词之后,才能进行进一步的研究工作。(2)不良词词库构建,构建不良词库,将不良词汇进行入库处理。借助不良词库检测不良词语会更加准确,同时为后续的文本分类提供一定的依据。(3)不良词的确定与分类,不良词的识别与分类是本文的重点工作,通过这两个工作的研究来达到本文研究的目的。(4)双决策模型的构建,不良信息的识别与分类用两个“大脑”进行运作,一个大脑是爬虫获取文本并进行特征提取进而信息识别,这类比于AlphaGo的“落子选择”网络;一个大脑是基于规则和统计的方法进行不良信息库的对比及分类,这类比于AlphaGo的“价值网络”。
其他文献
Ⅲ-Ⅴ族锑化物是半导体材料体系的重要组成部分,由于其独特的能带结构、有效质量小、电子迁移率高等优良特性,在超高速低功耗器件和红外光电领域有着重要应用。特别是量子点
独立性是一个经典的概念,各种独立数是现在国内外图论研究的一个重点课题.在1998年,美国图论学者Haynes等出版了专著《Domination in Graphs》和《Fundamentals of Dominatio
罕见病患者的医疗权益保障问题事关罕见病患者的生存与发展,事关制度的正义。近年来,我国的罕见病立法逐渐受到重视,出台了一系列罕见病法律规定,改变了无法可依的状态,对维
在光电子领域半导体硅材料占据主导地位,这是由于硅材料具有成本较低和现代标准COMS工艺兼容性较好的优势;但是硅由于带隙限制使其对高于1.1μm波段红外光吸收很低,因此硅材
为了快速准确地估算出裂尖张口位移,以承受单向拉伸的含有中心穿透裂纹的平板为研究对象,提出了一种基于裂纹最大张口位移确定裂尖张口位移的简便方法。该方法首先以平面应变
近年来我国为支持乡村振兴,出台了一系列政策措施,政策性农业保险就是推动乡村振兴的重要政策措施之一,在农户应对自然灾害和维持稳定收入方面起到关键性的作用。福建省作为
在进行人体脊柱或其他部位的骨科手术时,有时需要获取完整对象如脊柱全长的X线解剖结构图,来辅助医生对手术操作及手术质量的评估。当前,由于X线成像设备受尺寸及拍摄位置等
随着发光二极管的迅速发展,高发光率、低功耗、长寿命、低成本的LED光源广泛应用于家居照明、交通指示,广告显示等领域。在智能交通领域,基于LED的可见光定位技术能够利用现
随着数字媒体技术的发展以及移动智能设备的普及,人类已经全面进入信息化时代,图像也因此成为了人类以及机器汲取信息的主要方式。但由于成像设备的硬件限制和外界环境的干扰
禁止双重危险规则是一项非常古老的刑事诉讼基本原则,其最初的基本含义是指任何人都不得因同一项罪行而受到两次以上的刑事追诉,审判和定罪处罚。这一规则的运用平衡了惩罚犯