一种针对不良主题的文本过滤方法

来源 :信息安全与通信保密 | 被引量 : 5次 | 上传用户:wpsl5168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不良文本的过滤问题,文章提出了一种基于SVM分类器改进的文本过滤方法。该方法将传统的基于词语的分类方法改为基于词语元组的分类,增强了特征项的分辨率,实验表明该方法同传统的过滤方法相比具有较高的准确率和召回率。
其他文献
研究了如何利用Washout滤波器的混沌控制技术来控制Colpitts振荡器中的混沌.首先得到振荡电路的归一化状态方程及基于Washout滤波器技术的控制方程,然后通过调整滤波器的控制
为了查明泥炭分子化石记录的古植被状况与古植物学分析结果的差异,并进一步探讨这些分子化石所记录的古气候信息,本文利用气相色谱仪(GC)、气相色谱-质谱联用仪(GC-MS)、气相
在长江三峡东段黄陵背斜核部结晶岩分布区,选择6条有代表性的地质地形剖面,恢复了古地形,通过古今地形对比,计算出不同地貌部位的剥蚀厚度.又根据剥蚀沉积相关原理,在黄陵背斜相邻沉积区——江汉平原的沉积地层中,确定了黄陵背斜结晶岩初始剥蚀的层位和年代为56.5 Ma.大面积的强烈剥蚀大约发生在2.4Ma左右.以地形极点、流域系统、地形层面及整体平均四种体系,计算出了不同点、河流上中下游、各地形层面及整体
提出一种新的基于辛几何谱的时间序列确定性检测方法,通过计算原始时间序列及其替代数据的辛几何谱,利用非参数Mann-Whitney 秩和检验方法,可有效地辨别确定性混沌过程和随机
实际电力系统运行中,发电机和负荷的功率随时都在变化,发电机中各状态变量(功角、转速等)和代数变量(交轴、直轴的电压和电流等)分布在一定范围内.计算发电机变量的概率特性
为了正确识别出地图中各种形态的数字注记,提取了地图数字注记中的正交傅立叶-梅林矩(OFMMs)作为不变特征,它同时表征了数字注记的尺度和角度信息,但在提取了数字注记的特征O
森林培育学科专业博士研究生怎样学好党的十七大报告.学什么?作者根据中央精神,结合对博士研究生教育培养.思想政治教育和专业学习、科研要求.从十七大博大精深的报告中.梳理
介绍了近年来研制的一台多波长激光雷达及其探测对流层高云和气溶胶的实验,并依据探测结果重点分析了北京2000年1月至4月对流层上部云和气溶胶在532 nm波长的消光系数分布特
本文在阐述公平理论基本内涵的基础上,论述了公平感在班级管理中的重要作用,主要体现在三个方面:公平是班级健康发展的基础,是形成良好班风和学风的关键,公平有利于学生身心
长期以来,提高高校日语专业学生的日语听力水平成为一个难题。文章针对我国日语听力现存问题及原因,指出教学中的问题、寻找改进的方法和途径。以优化教学的角度与日语教育者