论文部分内容阅读
随着科技的日新月异与通信技术的蓬勃发展,利用智能移动电话来交流沟通己然成为大多数人日常生活的一部分,与此同时,部分公司或个人为了追求经济利益或者政治目的利用智能手机中的开放性对短信服务和电话服务进行骚扰甚至诈骗,极大地危害了使用者的个人信息、财产安全。其中,垃圾短信制造者出于商业目的或其他诈骗目的向手机用户大量发送垃圾短信或诈骗短信,使得手机用户不堪其扰,因此探索并研究一种高效、准确的垃圾短信鉴别方案是维护短信业务正常运行、降低用户受骗的重中之重。另外,电信运营商己将骚扰电话的识别监控列为需重点解决的问题之一,而运营商通常是以被动方式来识别骚扰电话,即在接收到对指定骚扰电话的投诉时,通过回拨的方式进行确认,确认后再发起对骚扰电话的拦截,但是此方法效率低不及时,无法有效解决骚扰电话问题。所以,如何高效且尽可能主动、及时拦截诈骗电话是保障用户信息安全的必要手段。为此,本文在对现阶段垃圾短信过滤识别与诈骗电话拦截方案调研分析的基础上,针对性地作了以下研究:(1)就传统基于内容短信恶意辨别手段所面临的判别效率低下、策略单一的问题,提出采用朴素贝叶斯机器学习算法对恶意短信予以识别,可通过扩大训练集来提高识别率,并运用Spark Streaming构建了机器学习的实时流处理程序,对诈骗信息实现了秒级的识别。(2)就传统垃圾短信过滤算法无法应付短信大数据的处理需求,而无法高效对短信予以识别处理的问题,提出采用Spark并行计算框架,将大数据技术与垃圾短信过滤技术结合起来,利用分布式文件系统高容错性、高吞吐量的优势提高数据处理能力。(3)就现阶段骚扰电话拦截中采取被动拦截的策略存在的无法及时有效提醒用户的漏洞,提出采用两层认证判定的方式来对恶意电话进行识别,一方面预先建立自有号码库的方式,尽可能免除传统采取的被动拦截电话可能对用户造成的不良影响;另一方面,对未知状态的陌生电话进行通话录音、上传、鉴别的方式,及时地给出相应的提示。(4)设计并实现了一个基于Spark+的智能手机防诈骗系统并进行了功能测试、性能测试。实验结果显示,本系统具备完善的恶意短信与电话数据鉴别能力。