基于最大熵模型的藏文不良文本识别系统的设计和实现

来源 :西藏科技 | 被引量 : 0次 | 上传用户:cbbbb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网不断发展,境外反动势力利用网络传播不良信息呈愈演愈烈之势,尤其在藏文信息方面。利用最大熵模型,可对网络藏文文本进行分类,识别不良藏文文本及正常藏文文本。用互信息进行特征提取,建立藏文不良文本库用以训练最大熵模型,利用 Opennlp 最大熵工具包实现功能,利用最大熵模型求出文档属于不良文本和合法文本的概率,通过分析准确率、召回率对识别结果进行分析。通过实验实现了最大熵算法进行藏文文本分类功能,用最大熵算法进行藏文不良文本识别效果比较明显。
其他文献
结合运行实践,对影响燃气轮机联合循环机组可靠性的因素进行了分析,并着重介绍了提高可靠性的途径与措施,得出结论并提出建议,以提高燃气轮机联合循环机组的运行可靠性,保证
随着社会的不断发展,为社会培养具有英语特色的高技能的复合型人才是高职高专教育的趋势。本文就高职高专英语教学中现存的问题,高职高专英语教学应该如何突出专业特色,怎样
根据光电位置敏感器件的原理和光点位置方程分析了PSD的非线性成因,并根据PSD的非线性特点,提出用神经网络的共轭梯度算法对PSD的非线性进行补偿.利用神经网络共轭梯度算法具
企业作为产品的拥有者,该如何与消费者进行良好的沟通?简而言之,是用消费者的语言与消费者进行沟通。显然,消费者的语言只是让产品诉求更加贴近消费者,更具有亲和力。企业若想得到
为探讨珠江流域蒸发皿蒸发量的时空变化特征,该文利用1960-2001年65个气象站的小型蒸发皿观测资料,采用Mann-Kendall趋势检验方法、完全相关系数法以及GIS空间分析技术分析了
1,4-双[2-(3,4,5-三甲氧基苯基)乙烯基]苯(简称HPV)是导电高分子材料之一.研究了电极材料、反应电流、溶剂、反应物浓度、反应温度等因素对电化学合成HPV的影响.实验表明在所
在对全密度反应器现场施工中难点和关键点,如锥体和筒体组装成形尺寸、接管定位、防止焊接变形、防止焊接裂纹等工序分析的基础上,提出相应的质量控制措施和对策。成功地完成
目的观察急性冠脉综合征(ACS)患者实施院前急救干预的效果。方法将实施院前急救的60例ACS患者设为院前急救组,自行前往医院就诊的60例ACS患者设为对照组,比较两组发病至用药时间
微积分在经济学中运用广泛,在社科领域,经济学是迄今为止最早最成功地实现数学化的学科,本文将从具体实例来阐述微积分的应用教学思想:从供需模型出发,先给出均衡理论;后将其
英语教学是师生之间教与学的过程,也是师生进行情感交流的重要手段,情感互动在英语教学中起着十分重要的作用。