一种含有负项的关联文本分类

来源 :第三届全国信息检索与内容安全学术会议 | 被引量 : 0次 | 上传用户:mixcenter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联文本分类中,如果特征词分布不均衡,特征词出现频率低的类别的规则集常被特征词出现频率高的类别的规则集所掩盖,分类器的预测能力变弱,因此提出了一种新奇的挖掘含有负项的分类规则的方法,一定程度上增强了被掩盖类别的规则集的分辨能力。从大量的实验结果看出该方法是行之有效的,能够提高分类器的预测能力。
其他文献
增量学习算法被广泛用于解决面向大规模数据集的机器学习问题。针对文本分类问题,该文提出了增量学习算法的一般性问题。基于拉推策略的基本思想,该文提出了文本分类的增量学习
渐进直推支持向量机(PTSVM)扩展了直推支持向量机(TSVM),有效地解决了不同样本分布需要人工指定工作集正负样本比例问题。但是,把二分类扩展到多分类并非易事。本文提出了一种
会议
目前,果树生产中喷洒农药是防治害虫的主要手段,然而果园中发生的害虫和广泛存在的害虫天敌,在长期的进化过程中,逐步形成了相互依存、相互制约的生态平衡关系。在农药防治害
在关联文本分类算法ARC-BC中,往往采用人工收集训练样本的方法,由于人工方法的主观不确定性使得收集到的训练样本的质量有差异,使得分类器的分类效果受到影响。本文提出了一种根
目的 分析社区家庭健康教育护理责任制应用于糖尿病患者的临床效果.方法 收集我院2012年2月-2013年2月期间诊治的糖尿病患者80例作为研究对象,采用随机分组的方式将患者分为
本文给出三种启发式规则用于获取根集文档的质心向量。通过使用给定的正例文档,本文首先构建一个与其对应的质心向量,然后利用它提取未标识数据集中的可靠正反样例。文本分类器
提出了一种基于特征空问相对可分性的层次支持向量机多类分类方法,解决了现有算法存在的不可分区域问题。在特征空间中以样本类别的相对可分性为权值构造最小生成树,确定类别的
会议
目的 探究分析腹部外科手术风险及治疗.方法 选取我院自2004年1月-2012年12月收治的行腹部外科手术患者3102例,作为临床研究对象.将所有患者进行随机分组,每组各1551例,试验
目的 分析妊娠合并急腹症的病因、诊断以及治疗方法.方法 对26妊娠合并急腹症患者进行回顾性回访.结果 4例卵巢肿瘤蒂扭转(15.4%),2例急性阑尾炎(7.7%),2例急性胰腺炎(7.7%),
4月初,GHF主席Tim Wilkens表示,将在中国实施2.5亿美元的援助住房计划。这项计划将在3个月后由基金会的亚太地区董事会宣布具体的实施措施。 In early April, GHF Chairman