基于改进KNN的个性化邮件分类研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:wyitzl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,相关网络信息越来越多,相应的电子邮件使用已经很频繁,并且已经深入到所有使用网络的人群中,成为一种方便快捷、经济的通讯手段。但是由于利益的驱动,垃圾邮件也在同步发展,垃圾邮件以各种各样的方式出现,不仅浪费了用户大量的时间,而且占用了网络带宽,污染了网络环境。反垃圾邮件问题,已成为全世界迫切关注的重要课题。   由于社会分工的不同、个人兴趣爱好的不同,人们对信息的需求也越来越专业化,越来越个性化。个性化服务技术的出现,满足了用户实际的需要。将个性化服务技术应用于邮件分类是一个新的研究方向。为了实现个性化服务,需要设计一种合适的模型来收集用户的兴趣度,最后根据用户对邮件的兴趣大小作为评判邮件是否为垃圾邮件的最终标准。   不同用户对邮件是否为垃圾邮件的标准是不一样的,不同的用户对同样的邮件可能有不同的反应。首先,通过对个性化服务技术、邮件分类技术进行回顾,在研究用户对页面处理行为的基础上,提出一种基于改进K近邻值法(K-Nearest Neighbors,简称KNN)的分类兴趣的方法,本文针对接受邮件的无规律化和邮件类别数量相互之间的不均衡等特点,提出了一种改进的KNN个性化邮件过滤方法。该方法先通过对兴趣度计算的改进,剔除用户习惯对建立兴趣度模型带来的影响,然后通过对类偏移问题的研究,提出了改进KNN算法,其对邮件进行了较好的分类。经实际验证:改进后的KNN个性化过滤方法能基本准确地实现根据用户兴趣对邮件进行个性化分类。   最后,在基于改进KNN分类算法的基础上,设计完成了个性化邮件分类系统,并实现了个性化的分类功能,系统使用时会隐式地收集用户兴趣,然后根据用户兴趣对邮件进行分类,经实际验证:该系统能基本准确地实现根据用户兴趣对邮件进行个性化分类。
其他文献
无线传感器网络集多种技术于一身,如传感器技术、分布式信息处理、嵌入式计算以及无线通信等技术。它提供了新的采集数据的方式,将物理世界与信息世界紧密地融合在一起,改变
近年来,伴随着网络技术和视频多媒体技术的快速发展,数字化的视频信息所含有的庞大的数据信息,以及在传输中所需求的巨大带宽资源,给信息的存储和信息的传输带来了巨大的挑战
无线传感器网络是由大量的按需部署在无人值守的监测区域内的廉价微型传感器节点组成的无线自组织网络,它通过传感器节点获得监测区域的物理信息。因此,它可被广泛应用于国防
随着网络通信、计算机科学与信息技术的发展,数据流作为一种新的数据形式在金融数据分析、网络监控、电信数据处理与传感器网络等领域有着广泛的应用。相对于静态数据,数据流
工程陶瓷材料的显微结构对其性能有重要的影响。由于多数材料是不透明的,其几何特征通常不能从块体样品中直接获得,传统方法通过在显微镜下获取样品的二维截面图像,来对其显
随着计算机技术的发展以及人类对移动通信需求的不断增加,下一代无线网络将是一个由各种无线接入技术组成的异构网络。在异构网络中用户将享受更多的服务并可随时随地接入网
受限于目前移动设备计算能力、存储能力和网络支持能力,移动设备尚不能支持普通个人电脑上的规模度的应用程序。应用程序如果要在移动平台上运行,应用提供商必须为移动设备重
随着Internet和Web技术的飞速发展,Web已经成为一个海量动态的信息资源库;而文本是信息最重要的载体,研究表明信息有80%包含在文本中。因此人们迫切需要能够从Web文本数据中快
近年来,随着Internet技术的迅速发展,J2EE和Ajax两种框架构建模式逐渐走向成熟,国内外对此有较深入的研究。在Web开发中,它们充分发挥了各自的优势,取得良好了效果。与此同时
Web数据挖掘是在Web资源环境中根据用户的浏览行为提取出用户关心的、有价值的信息过程。Web使用挖掘是数据挖掘的重要组成部分,用户是Web使用挖掘的核心。Web使用挖掘通过关