基于自分簇自学习算法的垃圾短信识别

来源 :吉林大学学报(信息科学版) | 被引量 : 0次 | 上传用户:xxf103000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾短信发送者会不断尝试修改垃圾短信内容以欺骗过滤系统,导致识别准确率降低,为此提出一种基于自分簇自学习算法的识别方法.首先以最小编辑距离的方式构建垃圾短信关系链,使用MeanShift算法对其进行聚类实现自分簇功能.之后计算每个簇核心,并以与核心的距离确定每个样本的权值,以权值样本训练分类器,当新垃圾短信样本被分类器识别后,会被归类到某个簇并重新计算该簇的核心和各个样本的权值,并更新分类器,重复此过程实现自学习功能.实验结果表明,新方法准确率提高约2.51% ~5.14%,且能长时间保持.
其他文献
3D打印又称为增量制造或增材制造,是以数字模型文件为基础,通过软件与数控系统将专用的打印材料,采用多种方式逐层堆积,制造出实体物品的制造技术.美国Impossible Objects(字面意思为“不可能物体”)公司是一家专营3D打印机和3D打印材料的公司,在增量制造和复合材料制造方面取得了领先进展.基于多年的研发,该公司创立了一种称为“复合材料基增量制造”(composite-based additive manufacturing,缩写为CBAM)的技术,据称这是一种全新的工艺,与传统的增量制造技术有着
期刊
为解决传统扰动观察法误判、振荡和追踪速度慢的问题,提出一种基于功率预测变步长扰动观察法的控制策略.当采样频率固定,光强不变温度变化的情况下,单位时间内光伏电池的输出功率曲线可近似为线性变化.利用步长较大的传统扰动观察法的快速性追踪到最大功率点附近,然后进行线性化功率预测,进而精确地追踪到最大功率点.并在仿真平台中搭建仿真模型,结果表明新的控制策略提高了系统的跟踪速度和精度,优化了系统的输出性能.