垃圾邮件过滤中信息增益的改进研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:youxiang123hao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对垃圾邮件过滤中的特征项选择问题,提出了一种改进的信息增益方法.首先利用特征词的先验概率定义增益比,然后利用增益比对特征词为整个分类所提供的信息量进行放大或弱化,从而对特征词的类别条件熵计算作了改进,采用极大后验假设朴素贝叶斯决策方法在英文语料库上进行实验,通过召回率、正确率、精确率和错误率对算法进行评价分析.实验结果表明,改进后的算法提高了过滤器的分类精度,降低了过滤器对合法邮件的误判给用户带来的损失.
其他文献
人体的运动过程较为复杂,图像中的相似动作很多,对传统的特征识别形成干扰,造成识别准确性不高。为了提高其识别正确率,提出一种Hu不变矩和人工鱼群优化支持向量机的人体运动姿态识别模型(Hu-AFSA-SVM)。首先,以二维连续图像为基础,提取图像中人体运动姿态识别的7个Hu不变矩,然后将其输入到SVM中进行训练,并采用AFSA对SVM参数进行优化,通过寻找一个最优超平面,尽可能在满足分类的限制条件下,
在开放和动态环境下,系统或环境的不安全的运行时变化可能为整个系统的正确执行埋下隐患,可能最终导致软件失效.基于监控器的软件运行时验证技术已经成为开放环境下侦测软件
高校档案工作是维护高等教育真实历史面貌的重要事业,也是高等教育发展的重要基础,因此必须切实予以加强。我们泉州医学高等专科学校刚从泉州卫生学校发展起来,档案工作有了一定
随着开源软件项目规模的增大,如何快速地学习、理解一个软件项目成为基于复用的软件开发活动中的一个重要环节.这些开源软件项目的源代码和文档集的数量都比较庞大,开发人员
随着我国社会经济的发展与变革,各种各样的新观念,如竞争观念、价值观念、效率观念等逐渐被人们所接受,更新了人们的思想意识。在变革中,作为社会主义建设重要组成部分的档案工作
根据多光谱图像和全色图像非下采样Contourlet变换(NSCT)后低频子带和高频方向子带不同的融合目的,提出了一种基于NSCT系数局部特征的遥感图像融合方法。首先将全色图像和多光谱图像的I分量进行NSCT变换,在低频子带采用有选择的加权求和规则,对于高频方向子带系数,在最高分解层上,采用高频方向子带系数绝对值较大的算子,而在其它的分解层,根据高频方向子带系数的区域方差,比较一定区域内各个系数区
7月7日,中船重工技术档案馆董俊翼副馆长等一行三人赴宜昌与三峡档案馆进行了馆际交流。三峡档案馆毛馆长从三峡档案馆的机构设置与职责、档案工作考核情况、档案安全管理体系
电子文件中心的建设,是我国进入21世纪以后,档案部门为了适应现代化建设发展,借鉴发达国家经验、应用现代技术与标准,通过自身实践探索开展的一场档案管理模式的变革。
高校认真贯彻落实胡锦涛总书记在中国农业人学师生代表座谈会(五四运动90周年前夕)上的重要讲话精神,切实加强和谐校园建设,进一步营造良好的校园氛围,对引导学生树立止确的世界观
认知无线电(CR)技术和能效(EE)通信设计这两种技术已经使得系统分别达到较高的频谱效率(SE)和能源利用效率(EE).然而在认知无线电系统中,既要保持较高的频谱效率,又要使得能源利用效