基于自分簇自学习算法的垃圾短信识别

来源 :吉林大学学报（信息科学版） | 被引量 : 0次 | 上传用户：xxf103000

【摘要】

：

垃圾短信发送者会不断尝试修改垃圾短信内容以欺骗过滤系统,导致识别准确率降低,为此提出一种基于自分簇自学习算法的识别方法.首先以最小编辑距离的方式构建垃圾短信关系链,使用MeanShift算法对其进行聚类实现自分簇功能.之后计算每个簇核心,并以与核心的距离确定每个样本的权值,以权值样本训练分类器,当新垃圾短信样本被分类器识别后,会被归类到某个簇并重新计算该簇的核心和各个样本的权值,并更新分类器,重复此过程实现自学习功能.实验结果表明,新方法准确率提高约2.51％～5.14％,且能长时间保持.

【作者】

：

李根王科峰贲卫国宋微刘鸿儒徐亦晋

【机构】

：

中国联通网络通信集团有限公司吉林省分公司,长春130021;吉林大学计算机科学与技术学院,长春130012

【出处】

：

吉林大学学报（信息科学版）

【发表日期】

：

2021年5期

【关键词】

：

编辑距离聚类算法自学习垃圾短信

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

使用碳纤维和玻璃纤维的一种3D打印工艺

3D打印又称为增量制造或增材制造,是以数字模型文件为基础,通过软件与数控系统将专用的打印材料,采用多种方式逐层堆积,制造出实体物品的制造技术.美国Impossible Objects(字面意思为“不可能物体”)公司是一家专营3D打印机和3D打印材料的公司,在增量制造和复合材料制造方面取得了领先进展.基于多年的研发,该公司创立了一种称为“复合材料基增量制造”(composite-based additive manufacturing,缩写为CBAM)的技术,据称这是一种全新的工艺,与传统的增量制造技术有着

期刊

基于功率预测变步长扰动观察法的最大功率追踪

为解决传统扰动观察法误判、振荡和追踪速度慢的问题,提出一种基于功率预测变步长扰动观察法的控制策略.当采样频率固定,光强不变温度变化的情况下,单位时间内光伏电池的输出功率曲线可近似为线性变化.利用步长较大的传统扰动观察法的快速性追踪到最大功率点附近,然后进行线性化功率预测,进而精确地追踪到最大功率点.并在仿真平台中搭建仿真模型,结果表明新的控制策略提高了系统的跟踪速度和精度,优化了系统的输出性能.

期刊

光伏特性最大功率追踪功率预测扰动观察法

基于自分簇自学习算法的垃圾短信识别

其他学术论文