基于文本和图像的垃圾邮件过滤系统研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yh603469940
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,电子邮件的使用也变得相当普及,但随之而来的垃圾邮件却给人们带来很大的危害和经济损失。因此,垃圾邮件的自动过滤技术受到越来越多的关注。然而目前的过滤技术很少针对群发垃圾邮件内容相似的特点,耗费了资源,同时,对图片垃圾邮件的过滤研究也刚刚处于起步阶段。 本文针对群发垃圾邮件内容大量重复的特征,根据Edehnan等人的脑感知学习模型提出了一种新的基于感知学习的垃圾邮件过滤算法,并依此设计了一个自学习合作式网络垃圾邮件过滤系统框架模型,并行的对文本和图像邮件进行处理。 该过滤系统中包含三个核心技术:文本邮件特征提取,图像邮件特征提取,以及基于感知学习的垃圾邮件过滤算法。文本邮件特征提取采用改进的文本数字指纹技术将邮件文本进行分段,对各段进行编码,生成特征向量,通过比较各文本之间的特征向量,得到邮件文本之间的内容相似度矩阵。图像邮件特征提取先对图像中的显著文本区域进行定位,接着将文本区域用SIFT(Scale Invariant Feature Transform)特征表示方法生成特征点向量,并依此计算邮件之间的相似度矩阵。基于感知学习的垃圾邮件过滤算法是系统的关键部分,算法中将脑对陌生事物的记忆学习类比于系统中对未知邮件的学习,最后给出了仿真实验结果。结果表明,该算法可以有效的识别内容相似的垃圾邮件,并对新出现的垃圾邮件有较快的反应能力。
其他文献
开关磁阻电机(SRM)驱动系统是20世纪80年代迅猛发展起来的一种新型电机驱动系统。SRM以其结构坚固,成本低廉、控制灵活等优点引起人们越来越多的关注,在工业上的应用很有前景。但是SRM物理转子位置传感器的存在影响了电机控制系统的高速性能、可靠性和成本,所以研究转子位置间接检测技术是开关磁阻电机系统研究的重要课题之一。本文分析了开关磁阻电机的结构和运行原理,并对国内外的SRM转子位置间接检测技术的
音乐驱动的虚拟现实技术是计算机图形学的一个分支,有广阔应用前景。现有的大部分研究工作多注重音乐与舞蹈动作一致性的研究,而忽略了音乐与舞蹈在情感层面上的联系。针对这种
随着全球纺织工业竞争的日趋激烈,纺织工艺的优化和纺织品质量预报越来越重要。而纺纱工艺流程长,生产过程中涉及的参数多达数百个,且纱线的品种繁多,性能各异,工艺参数变化
现代电网日益复杂化,对电力系统的安全稳定运行提出了更高、更严格的要求。微机保护是保障电力系统安全稳定运行的有效手段之一。随着数字信号处理技术(DSP)的广泛应用,微机保护的发展趋势将是基于高性能的DSP硬件平台和嵌入式实时操作系统的多功能化和智能化的微机保护装置。本文在研究μC/OS-Ⅱ和DSP TMS320VC5402基础上,分析了目前微机保护的现状,针对目前微机保护的不足,提出了基于DSP的硬
电接触科学中,微动是指在静接触对中,两个接触表面产生的微米级的相对运动。在电连接器接触对之间有微动产生时,会形成微动磨损和微动腐蚀,在这两种微动模式的共同作用下,最
利用人体肌电信号实现智能仿生灵巧手的控制,不仅可以促进残疾人事业的发展,在康复医学和微创外科手术领域也具有重要的应用价值。现有的智能仿生灵巧手肌电控制方式主要有:
随着我国“四纵四横”的客运专线以及城际客运系统获得国务院的批复,高速电气化铁路的建设已在我国全面铺开。2014年我国提出“一带一路”的发展战略,大力推动了我国高速电气
电站的主要动态特性包括非线性、多变量耦合和不确定性,采用传统控制方法难以实施有效控制。本文针对联合循环燃气轮机的特点,采用小偏差线性化法建模燃气轮机不同工况的模型
可视媒体是图像、视频、数字几何等的统称。作为虚拟现实技术的重要组成部分,可视媒体在诸多领域有着广泛的应用前景。可视媒体的构建方法主要有几何构建和基于图像的构建两种