基于行为识别的垃圾邮件过滤系统的研究与实现

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:youfei741101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子邮件以其传递信息便捷快速的优势己经成为了最为普遍的交流应用之一。虽然电子邮件可以给网络用户提供很大方便,但是同时也会带来某些非常严重的隐患,即有可能会有一些垃圾邮件。垃圾邮件通常数量众多,会在很大程度上挤占网络的带宽资源,从而使得网络通信信道拥堵,让许多网络用户没办法连接到目的网络或者没办法浏览和编辑一些重要的正规邮件。这会大大消耗用户的时间和精力,也会使得网络资源的应用不合理,进而严重损害了互联网的正常秩序和网络安全。所以,怎么去掉网络上面的大量垃圾邮件并且去除垃圾邮件的效率已经变成了网络用户和邮件提供商的亟需解决的问题。当前,去除垃圾邮件的相关技术以及相关研究在互联网的应用领域之中。然而,分析已存在的过滤技术,垃圾邮件过滤方面还存在一些问题,如已存在的的过滤方法精确度不高,经常出现误判的情况和对垃圾邮件过滤精确度高的技术存在耗时过多和用户信息泄露等等的问题。为了进一步加快判断的速度且提高垃圾邮件判断精确度,本文不仅通过研究邮件头的特征,还结合随机森林的特点,将随机森林算法应用在邮件过滤中。这样不仅能够提高判断邮件属性的准确率,同时还提高判定效率。基于行为识别的垃圾邮件过滤系统的研究与实现的工作包括一下内容:1、利用F-score法找出被判定为垃圾邮件的重要行为。根据大量的垃圾邮件分析的得出属性为垃圾邮件所表现出来共同行为特征,将这些行为特征采用F-score方法选择出具体代表性的行为特征。最后,随机森林算法使用被选择的最优行为特征去判定垃圾邮件的可能性。2、构建基于行为识别的随机森林算法垃圾邮件过滤模型。本课题的研究展示了多种垃圾邮件过滤方法,在对这些方法进行充分的分析以及比较之后,最后本文确定把基于行为特征的随机森林方法应用到垃圾邮件的过滤之中。基于当前学术界所应用的一些成熟实验环境和数据信息,对基于行为识别随机森林垃圾邮件过滤模型进行了搭建。本文研究了随机森林的基本结构、算法实现步骤以及训练数据的过程。3、系统的设计与实现。在已有的垃圾邮件过滤模型基础之上,与上文所设计搭建的随机森林模型进行结合,系统实现需求和功能方面的分析与定位,并且实现垃圾邮件系统总体框架的研究与搭建,本文所实现的系统,能够为垃圾邮件的快速和准确过滤展现出一类可行的方法。
其他文献
采用纳米SiO2、间苯二甲酸-5-磺酸钠(5-SSIPA)与聚苯硫醚(PPS)共混,利用双螺杆挤出机制备纳米SiO2/5-SSIPA/PPS共混母粒,采用差示扫描量热仪和扫描电子显微镜研究了纯PPS,SiO2/PP
非小细胞肺癌(NSCLC)是临床常见恶性肿瘤,其发病率和死亡率均居我国所有恶性肿瘤首位[1]。尽管以吉非替尼、恩度等为代表的新型靶向药物在NSCLC治疗中取得令人鼓舞的成效,但NSC
对我室1960-1995年间做的1392例儿童尸检的病理与临床诊断进行了分析,结果表明:总的儿童尸检率为69.53%。尸检率以1981-1990年间为高,1971-1980年间最低。总的临床误诊率为30.9。各年代,各种疾病及各年龄组诊断符合率各不相
从影响土地利用的经济、社会、生态效益3个方面构建了综合效益评价指标体系,运用熵值法对评价指标进行确权,在此基础上用多因素综合分析法对珠海市白蕉镇2008—2012年的土地
以57个冬小麦基因型为试验材料,在稀植高产栽培条件下研究了旗叶长、宽和面积与穗粒数、千粒重和穗粒重之间的关系。结果表明,①旗叶长、宽和面积与穗粒数均为显著正相关,相关程
提出了600MW运行机组双背压凝汽器背压应达值的确定方法,并给出了计算模型。结合定洲发电公司600MW汽轮机组优化试验数据,计算得出了双背压凝汽器的最佳背压和循环水泵最佳运行
气管拔管过程是全身麻醉的重要结尾阶段,它并不仅仅是插管过程的逆转,拔管条件往往不如麻醉开始时有利,而是从受控到不受控制的情况的转变[1]。现将2例拔管困难报道如下。1病
防控新型冠状病毒感染的肺炎疫情,已成为当前最紧迫、最重要的政治任务。这是一场事关人民群众生命安全和社会大局稳定的特殊战役。我们要按照习近平总书记重要讲话重要指示批
报纸
“哪吒”这个神话人物形象太过深入人心,不管是《封神榜》还是《西游记》,哪吒都是叛逆英雄人物出现。闹海擒龙、剥皮抽筋、剔骨削肉、莲花重生。小说神话里演绎的少年哪吒是这
报纸
本文初步建立了一种用阳极溶出伏安法(ASV)进行土壤铅的含量及其化学形态研究的方法。同时测定了土壤对Pb(Ⅰ)的络合容量和吸收量,从而阐明土壤污染程度和抗污染的能力。本法