一种用于互动型不良信息过滤的贝叶斯改进方案

来源 :广西师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:xiao959907530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息过滤是文本挖掘领域的重要研究内容之一。针对互动型网络媒体信息(如BBS),提出一种新的信息过滤算法,该算法主要从特征提取和分类器构造两方面对Bayesian方法进行改进。在对不良信息的特征提取过程中,根据网络论坛的特征,在计算中文不良信息特征项的权重时,根据关键词出现的位置、次数以及词长等建立一个特征评估函数,并用它来替换TF—IDF公式中的TF项;同时,考虑到网络论坛中的良性信息与不良信息之间的不平衡分布,采用一种不对称的学习策略来设计Bayesian分类器。实验结果及对比分析表明,该算法具有较高的
其他文献
基于豌豆叶色素乙醇溶液在蓝紫色的发光二极管(LED)照射下产生红色荧光,该红色荧光能被Hg^2+熄灭的现象,建立一种简便、快速、定性鉴定溶液中Hg^2+的新方法,实验证明其他阳离子基本
人体检测已经成为机器视觉研究的一个热门课题,针对以梯度直方图作为人体特征描述的人体检测算法存在密集人群检测率较低这一问题。本文根据人体特征差异性,提出一种可扩展梯度直方图人体检测算法,使用非统一的区域方式提取图片梯度直方图描述算子,有效改善传统梯度直方图算法在密集人群检测中漏检率过高的情况。
强震后对桥梁墩柱的损伤识别是灾后桥梁加固维修的重要依据,也是健康检测的关键技术之一。根据地震在桥墩结构任意节点处的作用是时域相关的特性,运用全量补偿复合反演算法对桥
结合地质背景资料,经野外调查观测、水化学室内分析,以及长期的雨量观测、地下水的建堰观测,对万华岩地下河系统有了一个较全面的认识.万华岩地下河系统规模较大,分为主洞、
对全局耦合映射(GCM)模型、Aihara混沌神经网络模型和Inoue混沌神经网络模型等模型的研究现状、构成和特点进行了全面的分析,综述了混沌神经网络的主要应用领域,并试探性地指
在气动分配阀实验台上,对双侧返料气动分配阀的调节性能进行了冷态实验研究。研究表明:分配阀单侧返料与双侧返料时,在未达到最大返料流率之前,返料流率随着流化风与松动风的增大
集成学习是提高分类精度的一种有效途径,已在许多领域显示出其优于单个分类器的良好性能。观察学习是一种基于社会学习理论的集成学习方法,以往对其研究集中于同构模式。在此提
以活性艳兰K-3R染料废水为处理对象,采用增强型内电解-光催化组合工艺,对影响处理效果的因素进行研究,得出增强型内电解-光催化处理活性艳兰K-3R最佳的工艺条件。结果表明:增