Naive Bayes邮件过滤模型的特征词选取方法研究

来源 :航空计算技术 | 被引量 : 0次 | 上传用户:aabbccdd654321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将文本分类中的各种特征词选取方法引入到Naive Bayes邮件过滤模型(NBF)中,包括文档频度、信息增益、互信息、期望交叉熵、文本证据权、几率比及χ^2统计量。分析比较了这些方法的特点。实验结果显示在NBF中采用χ^2统计量选取邮件特征词有最好的效果。
其他文献
电力目标市场的确定是制定电力营销策略的基础.首先运用可拓学中的物元理论建立了按分类电价分类的用电市场细分及其细分市场的物元模型,在模型中考虑了影响目标市场选择的相
股票价格的每日变化呈现随机漫步的特征,其一定程度的波动反映了股票变化的内在规律,但未能预期的股价的突然变化对投资者及社会经济却产生着巨大的影响,如股价突然大幅下跌
高血压病是一种以动脉血压升高为主要特征,累及心,脑,血管,肾脏等多种器官结构与功能改变的一种疾病。高血压病分为原发和继发两种,有90%~95%的高血压病患者属于原发性高血压
虚拟仪器是基于计算机和标准总线技术的一种全新仪器概念,结合某航电计算机的测试需求及PXI总线特点,构建了基于PXI技术的虚拟仪器作为设备综合测试平台,对该综合测试平台的建立
建立以直升机运动模拟和直升机作战对策体系为基础的空战模型和空中运动仿真理论,并对两架直升机的空战中的运动进行了数值模拟,模拟结果验证了空战中运动仿真理论的合理性.
目的探讨医患沟通的技巧及产前健康教育对产后抑郁症的预防作用。方法根据统计结果明确孕产妇健康教育需求及指导的关键环节,制定方案实施于产科的护理中。结果采用不同方式
心理护理是在护理过程中,护士通过各种心理学手段和途径,积极地影响和改变患者的认知、情绪和行为,以达到促进患者康复的护理目的。笔者经过三十年的临床护理工作经验,对急诊
介绍了Allen的区间代数及其扩展——INDU网络,将Heisenberg不确定性原理应用于IN-DU网络,将INDU的25种基本关系中两区间有端点相等的或区间段相等的这15种关系删除,这15种关
因为每个实际系统都存在参数扰动,所以两个参数不同系统的混沌同步更具有实际意义.利用混沌系统的同步化现象与渐进稳定的关系,并在混沌系统中利用参数自适应和驱动反馈,研究
给出了一种在高斯白噪声环境下对多个窄带信号进行二维波达方向估计的新方法。该方法根据给出的天线阵列结构的特点,首先构造四个相关矩阵,进而构造一个大的矩阵,对其进行一次特