面向中文敏感词变形体的识别方法研究

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户：drg45tg54h4h

【摘要】

：

针对网络信息中所包含的敏感词,尤其是中文敏感词变形体的识别成为了一个迫切需要解决的问题。通过分析汉字的结构和读音等特征提出了一种中文敏感词变形体的识别方法。该方

【作者】

：

付聪余敦辉张灵莉

【机构】

：

湖北大学计算机与信息工程学院,湖北省教育信息化工程技术中心

【出处】

：

计算机应用研究

【发表日期】

：

2019年4期

【关键词】

：

变形体敏感词识别编辑距离 KMP算法

【基金项目】

：

国家“973”计划资助项目(2014CB340404);国家自然科学基金资助项目(61373037,61672387)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对网络信息中所包含的敏感词,尤其是中文敏感词变形体的识别成为了一个迫切需要解决的问题。通过分析汉字的结构和读音等特征提出了一种中文敏感词变形体的识别方法。该方法针对词的拼音、词的简称和词的拆分三种敏感词变形体分别设计了基于易混拼音分组的敏感词的识别算法(SPGR)、字符串的简称识别算法(SNR)和基于KMP的汉字拆分识别算法(WS-KMP),有效提高了敏感词审查的准确率和效率。实验结果表明,该方法在识别中文敏感词变形体时有较高的查全率和查准率。

其他文献

出展管理呼唤行业自律——访中国贸促会展览管理办公室有关负责人

“借展出海”是企业“走出去”的重要途径之一。出展管理休系犹如导航的灯塔，组展服务机构犹如乘风破浪的巨轮，它直接搭载着中国制造驶向目的港——国际展会；随后是一系列参展法

期刊

中国国际展览中心中国机电产品中国轻工业对外经济技术合作公司国际博览会中国汽车工业对外经济技术合作慕尼黑机械行业中国机械设备进出口总公司

巴西2018年和2019年粮食总产量将减产5.6%和0.2%

<正>11月8日,巴西地理统计局(IBGE)发布的最新预测报告称,2018年和2019年,巴西粮食总产量将分别比上年减产5.6%和0.2%。巴西地理统计局预测,2018年巴西粮食总产量将达2.272亿

期刊

粮食总产量统计局

出展市场期待成熟(中)——中国出国(境)展览服务市场调查报告

<正>(二)机电类出国展会市场状况分析 1.出国目标国家与地区近年来,出展企业主要的参展国家和地区依此为德国、法国、意大利、美国、巴西、阿拉伯国家、埃及、南非,以及日本

期刊

参展商机电类市场调查报告标准展位参展人员展览服务

体外冲击波碎石术在双J管滞留结石形成中的应用

目的:探究双J管滞留结石形成患者接受体外冲击波碎石术治疗的价值。方法:选取双J管滞留结石形成患者50例,时间为2016年5月~2017年10月,其均接受体外冲击波碎石术治疗,对其治

期刊

体外冲击波碎石术双J管滞留结石

新农村规划建设中生态环境保护对策探索——以北京市延庆县刘斌堡村为例

本文通过在北京市延庆县刘斌堡村的具体实践,对新农村规划建设中的村庄生态环境问题进行了探讨,并针对这些问题提出了建设新农村过程中保护生态环境问题的对策方法。希冀在新

期刊

新农村建设生态环境保护对策

柚子皮制备生物炭吸附苯酚的特性和动力学

廉价的柚子皮作为原材料制备生物炭吸附剂对含苯酚废水进行吸附研究。扫描电镜结果表明,柚子皮制备的生物炭具有较好表面吸附空间结构,比表面积测定为261.69 m2/g。此外,能谱

期刊

生物炭苯酚柚子皮动力学等温线

碳标识和环境标志

国际标准化组织环境管理标准化技术委员会(ISO/TC 207)自1998年以来先后发布了环境标志、生命周期评价等一系列有关环境管理的国际标准。近年来,为积极应对气候变化,该委员会

期刊

碳足迹碳标识Ⅲ型环境标志和声明生命周期评价

基于Markov向量区制转移模型的利率与汇率波动相关性研究

文章采用一元马尔科夫区制转移模型分别研究了利率水平和汇率收益率的区制特征,然后运用二元马尔科夫区制转移向量模型研究利率水平和汇率收益率之间的区制相关性,得出结论:

期刊

向量区制转移模型利率汇率不完全传递

论群租者居住权保护中的政府责任——以公共租赁房建设为视角

采取与多人合租的方式进行群租是困难群体的无奈选择。政府部门不能仅仅以群租现象具有一定危害性就采取简单的方式进行整治或者以规章的形式加以禁止,而是应当履行服务行政

期刊

群租居住权政府服务公共租赁房保障

Fenton-混凝法处理苯胺废水

农药生产过程中产生的苯胺废水,COD浓度高、生物毒性强、可生化性差,一般生化方法很难处理。研究了Fenton与PAC联用处理苯胺废水。结果表明,Fenton氧化处理苯胺废水在最佳条

期刊

Fenton氧化混凝苯胺废水可生化性

面向中文敏感词变形体的识别方法研究

与本文相关的学术论文