基于文本分类的多层次垃圾短信过滤系统研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:YOOOZHANG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,手机短信受到广大用户的青睐,但此项业务产生的垃圾短信也严重困扰着人们的生活,干扰着正常的社会秩序,因此,各电信运营商纷纷出台垃圾短信过滤系统,以打击垃圾短信的严重泛滥。目前常用的过滤方法主要有黑白名单过滤机制,基于短信长度及流量的过滤机制,基于关键字匹配的过滤机制,以及基于文本分类智能算法的过滤机制,这些机制虽然在一定程度上遏制了垃圾短信的泛滥,但仍具有明显的缺陷和不足。本文受生物免疫系统的启发,借鉴生物免疫原理,提出了基于文本分类的多层次垃圾短信过滤系统的设计,系统分为几个模块,逐层过滤,环环相扣,使垃圾短信无处遁形。本文所做的工作以及创新点如下:(1)分析了垃圾短信的研究现状,包括成因、危害和主要特征,并对国内外现有的垃圾短信过滤机制进行了总结,探讨了各种机制的优缺点。(2)详细介绍了垃圾短信过滤关键技术,包括文本预处理、中文分词以及特征选择等技术。详细阐述了生物免疫系统原理以及由此开发的人工免疫算法,并对传统的算法进行了改进,简化了抗体和抗原的表示方法和计算方式,使亲和力的计算更加简单,节约了内存,提高了匹配速度。(3)设计了一个基于文本分类的多层次垃圾短信过滤系统,系统由黑白名单模块、短信长度及流量门限模块、内容快速匹配模块和人工免疫模块构成,制定了各模块的主要功能和系统的处理流程。(4)人工免疫模块通过对数据库里的短信进行训练,抗体自体耐受生成合格检测器,对短信进行分类,还可以通过变异机制不断更新短信特征样本库,维持短信样本库的生命力、多样性和自适应性。通过实验表明,相比传统方法而言,本文提出的基于文本分类的多层次垃圾短信过滤系统成功的提高了过滤垃圾短信的智能性、可靠性、正确率和实时性。是一种智能化的改进和完善,具有十分广阔的工程应用前景。
其他文献
物联网是当今世界信息产业发展的主要方向,随着物联网的发展,无线传感器网络(WSN)逐渐成为物联网感知层的主要组成和实现的关键技术,对其研究变得更为重要。目前在结合WSN网络特点
该论文阐述了帧中继与ATM网络互联系统的硬件设计和实现.在深入分析了帧中继和ATM原理和工作特点的基础上,探讨了实现帧中继与ATM网络互联系统的原理和实现方法,重点研究了帧
鉴于传统无线电缺乏灵活性,不可重构,无法升级的缺点,软件无线电系统提供了一种新型的无线电解决方案。它的设计思想是提供一种多频段、多模式、可重构的无线电台,为不同的通
该文对VoIP技术的发展以及IP电话系统中的关键技术和实现方法进行了详细的论述.首先分析了在系统实现中主要采用的一些关键技术:网络编程接口技术(Winsock)、媒体实时传输技
交联聚乙烯电缆因其优异的电气性能和机械性能,在输配电网络中的使用量不断增加,输配电线路故障常常发生在电缆接头处,而电缆本体与电缆接头两绝缘界面是绝缘最薄弱的地方,因
并行信号处理技术在高速实时信号处理中得到广泛的应用,它通过多处理器同时工作来减少任务的处理时间。本文结合典型的雷达信号处理模块:正交插值和脉冲压缩、某舰载雷达的对海
该文对蓝牙系统(Bluetooth)的高层软件特别是服务发现协议进行了深入研究,同时也对蓝牙系统与干扰问题,蓝牙系统的使用对移动通信网话务量的影响,蓝牙系统的实现方案等作了研
该文讨论了一个基于TriMedia芯片的嵌入式系统的设计.该系统通过PCI总线与Host机通讯,通过Host加载程序.在应用中,简单的单一任务可以在没有操作系统的环境下运行;而复杂的多
视频压缩、存储、传输和处理技术以及超大规模集成电路技术的迅速发展,大大扩展了视频技术的应用领域。 在传统的广播电视领域、娱乐领域和新兴的internet视频业务领域,视频