基于网页抓取分析和统计压缩模型的垃圾邮件过滤系统研究

来源 :信息网络安全 | 被引量 : 4次 | 上传用户:greenosnake
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾邮件过滤是当前计算机领域的热点问题。文章针对目前网页抓取分析技术不能深入分析网页内容的缺点,提出了一种优化的网页抓取分析技术,能够对网页提取一些更为深入的特征,并以此为基础,完成了基于网页抓取分析和统计压缩模型的垃圾邮件过滤系统的设计与实现。文章创新地提取出5种新的特征,实验结果表明,这些特征对于增高TPR(TruePositiveRate,真正类率),降低FPR(FalsePositiveRate,负正类率),提升垃圾邮件过滤的效率和准确性具有显著作用。
其他文献
提取《湘绮楼日记》中1869~1916年间长沙、衡阳地区夏半年(4~9月)的逐日天气记录,重建4~9月逐旬平均降水日数序列和6~7月逐候平均降水日数序列,与现代(1951~1980)长沙气象观测数据进行对比,发现当时梅雨期结束于7月3候,较现代推迟2候;梅雨持续时间2~3旬,比现代长约1旬。参考物候信息(历年平均蝉始鸣日期)得出结论:19世纪后半叶至20世纪初,冬季风势力强于现代,压制了副热带高压
本文通过对体育制度化的特征分析,提出:只有在法治下建立体育制度化框架,才能保证中国体育的健康发展.文章还进一步分析了,体育法的权威性与维系体育制度化的有效性.
文章分析了关于可信存储的各种规范和在各种情况下的设备更换方式,提出了三种密钥迁移模型。结合现有的密钥迁移技术,通过采用改进的封装方案,将源平台的各种软硬件的属性参数与所要迁移的密钥相绑定并封装的新方案。介绍了密钥与属性值的封装方式以及封装后的迁移过程。该方案保证了可信存储中密钥的迁移安全。
通过位移和速度传感器对举重专项练习的实时测试,获得举重运动员发力上拉杠铃的力学数据。结果显示运动员提拉杠铃的最大高度、最大速度和提拉重量之间存在显著性负相关;最大速
研究目的:膳食营养是保证运动员营养素的需要和维持体能的最重要的物质基础,对训练起重要的保证作用,与膳食营养在竞技体育中重要位置不相适应的是运动员膳食的不平衡现象普遍存