基于Naive Bayes的CLIF_NB文本分类学习方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:coralbird
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Naive Bayes方法中条件独立性假设常常与实际相违背的情况,提出了CLIF-NB文本分类学习方法,利用互信息理论,计算特征属性之间的最大相关性概率,用变量集组合替代线性不可分属性,改善条件独立性假设的限制,并通过学习一系列分类器,缩小训练集中的分类错误,综合得出分类准确率较高的CLIF-NB分类器.
其他文献
随着现代公路建设施工技术的开发,采用水泥混凝土材料进行铺筑公路路面,成为当前公路道桥工程施工的重要手段和方式。由于自然环境及施工技术等客观因素制约,水泥混凝土路面结构
分布式基于内容的发布订阅系统正受到日益广泛的重视,然而大多数研究都忽略了可靠性保证,这限制了该系统在动态和不可靠场合下的应用.本文首先介绍了基于内容的发布订阅系统和go
提出了实时Client/Server数据库多版本两阶段封锁并发控制协议.该协议具有多版本并发控制机制与两阶段封锁机制的优点,使用如下策略以减少延误截止时间事务数量:若冲突集中有
大学英语四六级考试中,在段落翻译题中考生往往失分较多。此文选取历年翻译真题、参考答案和问卷收集的学生答案为语料,自建四六级翻译双语平行语料库,借助TextEditor、Tmxma
以由浅入深的方式,对无缝线路常见故障产生的主要因素进行分析,进而说明该故障产生的原因,使预防故障、故障处理方案更加清晰、易懂,为无缝线路施工技术的全面推广起到促进作用。
随着国民经济的发展,建筑企业也随之不断的成长。根据人们对住房与智能相结合的实际要求,在实际设计与施工中智能、自动、电气等高科技的应用不断的涌现而出,由于此等原因对电气
安全以其复杂性和高计算性成为电子商务发展的瓶颈.本文根据中间件屏蔽复杂性的特点,提出了安全中间件的概念,并设计了安全中间件的体系结构.其中公共安全服务(CSS)作为安全
提出了基于超结构的分布式系统的关联规则挖掘的分布式算法(HSDM),该算法与现有的相关分布式挖掘算法相比,具有明显的优点.该算法不需要产生候选项集,只需两次扫描各站点局部