基于信息熵和决策分类技术的邮件识别研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:liuhuayu0472
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文通过对电子邮件头信息和正文内容进行离散和特征化处理,将一封电子邮件用向量组的方式加以表达;进而使用基于信息熵的决策树分类技术构建一种垃圾邮件分类识别模型;最后通过实验对该模型做了相关的检验和测试。实验证明,该模型经过一定数量的垃圾邮件和正常邮件的对比学习后,能够进行垃圾邮件的识别,具有较好的效果。
其他文献
采用乙醛丙酮分光光度法测定膏霜类化妆品中的甲醛。通过建立数学模型,分析了测定过程中的各种影响因素,如甲醛溶液浓度、定容体积、吸光度、样品称量,对不确定度分量进行了评定
“十二五”期间,环境监测仪器将迎来怎么样的发展契机?哪些种类的仪器将会大有作为?在2011年6月7—10日举办的第十届中国国际环保展览会(CIEPEC2011)上,中国环保产业协会技术部燕中
利用国家标准物质对渗透压摩尔浓度仪器的示值误差进行了重复检测,通过建立数学模型,对示值误差测量结果不确定度进行了评定,主要包括测量重复性、标准物质、仪器分辨力引入的不
6月13日,国家工业电器质量监督检验中心在乐清奠基开工。该中心为省、市重点建设项目,实验室占地10亩,总投资1.4574亿元,计划在明年底完成。中心的检验能力覆盖低压电器领域,在国内
对采用恒电流电解-BCO分光光度法测定纯铜中铜含量的不确定度进行了评定。对测量重复性、电解重量法、光度法等影响测量结果的不确定度分量进行了分析和量化。当纯铜中铜的质
网格模型变形往往需要保持局部几何细节,Laplacian网格变形算法能够较好地保持局部几何细节特征,但细节特征描述子-Laplacian坐标的计算欠缺精确性。从平面多边形中值坐标的角度出发,对Laplacian坐标进行重新定义,将顶点的一阶邻域投影到顶点处切平面上,根据顶点相对投影点的中值坐标构建的Laplacian坐标能够精确地描述模型的局部几何细节特征,实验验证能够获得较好的编辑效果。
以对象为基本检索单位的Web对象搜索技术正成为下一代智能搜索引擎的主要发展方向之一,而由于一些对象的部分属性具有时变性,高精度的时变对象辨识技术就成为实现高精度Web对象
本体学习技术的研究目前还处于探索阶段。研究了知识生产领域中本体学习技术的应用,提出了本体学习中领域本体的分类算法。本算法同时考虑了概念之间的语义相似度与结构相关度
采用电感耦合等离子体-原子发射光谱(ICP—AES)法测定烟花爆竹中16种化学成分并对测定结果的不确定度进行了评定和计算,提供了评定过程所需的各参数的采集和计算方法,定量表征了
双柱双检测器气相色谱法同时进样分析非甲烷烃,对甲烷、总烃、氧气和仪器引入的不确定度进行了评定。结果显示,本法测定不确定度的主要来源为标准气体的不确定度,其次是色谱分析