基于文本分类算法的垃圾短信过滤技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:lah822900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手机短信因具有移动性好、价格低廉、收发便捷和娱乐性强等特点而使人们逐渐习惯于用短信的方式来传送信息和进行沟通交流。但垃圾短信问题也变得日益严峻。因此,研究短信智能监管技术具有重要的意义。过滤技术是目前对付垃圾短信的主要手段,但采用现有的过滤方法时,短信中心需要对短信进行逐条分析,才能判断是否为垃圾短信,因此处理的效率比较低。同时不管是基于关键词还是基于内容的垃圾短信过滤方法,都存在大量运算,这样会造成短信服务中心网络堵塞,增加网络的成本,其最终结果是采用放弃部分垃圾短信的过滤或延迟短信转发,从而就会降低垃圾短信过滤的准确率和效率。因此,本文针对现有过滤技术的不足,提出了一个基于多层的垃圾短信过滤方法,该方法引入了用户信任度的概念,根据用户的信任度对用户发送的短信进行抽样过滤,这样极大的提高了处理的效率。同时该方法整合了多项垃圾短信过滤技术(黑白名单、关键词及内容过滤技术),该方法较之单一的过滤方法准确率和效率上有很大的提高。本文的主要工作包括:1.提出了基于短信行为特征的垃圾短信判别技术,由于不同的短信用户具有不同的发送行为,通过对短信发送行为的监测不仅可以实时监测垃圾短信,还可以对垃圾短信发送进行预测。2.由于绝大多数手机用户并不是垃圾短信制造者,本文引入了用户信任度的概念,根据用户发送行为确定用户的信任度级别。3.提出了根据用户信任度对用户发送的短信进行抽样检测的方法,该方法在兼顾垃圾短信过滤正确性的情况下,也极大提高了过滤系统对经过短信中心的垃圾短信的监测效率。4.根据提出的抽样监测方法,融合了已有的垃圾短信过滤技术,构建了一个多层的垃圾短信过滤系统。实验表明,本文中提出的新方法对垃圾短信的过滤具有较高的效率。
其他文献
“Self-NonSelf”(SNS)识别模型是传统人工免疫模型中的一个重要分支。美国免疫学教授Forrest基于SNS模型提出了否定选择算法,成功的模拟了免疫耐受的过程。然而Kim的研究表
移动目标视频跟踪是当前信息领域的前沿和热点方向,融合了计算机科学、自动控制、机器视觉、图像处理、模式识别、数学等多学科的先进技术。本文以智能视频监控作为主要线索,
随着信息社会尤其是互联网的发展,人们对文本检索的要求越来越高。对传统关键词匹配技术的改进,智能检索研究已经成为热点,并将是支撑下一代互联网的核心技术之一,将语义计算
随着人类基因组测序工作的完成,蛋白质分子序列数据呈几何级数增长。通过对蛋白质的分子序列的折叠结构的研究和分析,可以预测蛋白质的功能。这对于生物学、医学的研究发展有
高性能计算在气象预报、航空航天等领域有着广阔的应用前景,MPI是当前高性能计算应用进程间消息传递事实上的标准,集合通信是影响高性能计算应用性能的重要因素之一。自由光
矢量线可视化法以其能表示矢量场的连续性,绘制效果直观而广泛应用在工程实践中,已成为流场可视化的重要方法。随着科学模拟精度不断提高,矢量场的数据规模不断增大,传统的矢
提高软件的开发效率和质量是软件工程领域的一个巨大挑战,软件复用技术是解决这一问题的根本途径。开源软件的蓬勃发展,越来越多的软件发者、业余爱好者参与到开源软件开发中
无线传感器网络是一种无基础设施的无线网络,综合了传感器技术、嵌入式计算技术、分布式信息处理技术和无线通信技术。该技术现已成为国内外远程抄表系统中解决监控点地域广
在信息海量增长的压力下和人们对计算模式的移动性需求下,存储与计算的分离成为未来计算模式发展的趋势,网络计算是符合存储与计算分离要求的计算模式。iSCSI (internet SCSI
随着社会信息化的推进,信息量越来越庞大。如何保证这些信息被充分利用,实现信息价值的最大化,是一个迫切需要解决的问题。此外,信息类型也呈现多样化的特征,大量半结构化以