一种基于CHI值特征选取的粗糙集文本分类规则抽取方法

来源 :计算机应用 | 被引量 : 32次 | 上传用户:wjdy110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结合文本分类规则抽取的特点,给出了近似规则的定义。该方法首先利用CHI值进行特征选取并为下一步特征选取提供特征重要性信息,然后使用粗糙集对离散决策表继续进行特征选取,最后用粗糙集抽取出精确规则或近似规则。该方法将CHI值特征选取和粗糙集理论充分结合,避免了用粗糙集对大规模决策表进行特征约简,同时避免了决策表的离散化。该方法提高了文本规则抽取的效率,并使其更趋实用化。实验结果表明了这种方法的有效性和实用性。
其他文献
过去30年小肠移植取得了显著进展,现在小肠移植不再是一项被认为成实验性的技术,而是治疗不可逆性肠衰竭的可行治疗选择。根据小肠移植注册委员会近年公布的资料,全球小肠移
目的探讨以Tie2为靶点的基因治疗对结肠癌生长及肝转移的抑制作用。方法构建表达Tie2胞外可溶性片段(sTie2)的慢病毒载体pLenti-sTie2,建立BALB/C小鼠结肠癌皮下成瘤模型及肝转移模型。经尾静脉注射重组病毒载体,在不同时间点分别测量皮下移植瘤体积、经ELISA法检测小鼠血中sTie2的表达水平。2周后处死小鼠,观察肝转移的情况,并取瘤组织检测血管形成和细胞凋亡指标。采用SPSS
在高噪声环境下,实现远距离通讯是十分困难的。为了解决这一问题,本文提供了一种硬件以隔离电流环,软件以抗干扰通讯指令的解决方案。在高噪声的环境中,和传统485方式进行了对比
探索分布估计算法中基于群体递增学习算法在优化癌症化疗中的应用能力,并与遗传算法作相应比较。实验表明基于群体递增学习(PBIL)算法的搜寻速度以及搜寻到的可行解质量均优于遗传算法。
Rough集理论是一种处理不完备信息系统的数学工具,但是Pawlak的经典rough集理论似乎是不可行的,因为它要求论域中数据间有很强的等价关系。在产生基本集(相似类)时,一般相似关系的分类误差较大,集对分析会把两个对立度不为0的个体划分在一起。汲取两者的优点,给出相同度的概念,只有满足一般相似关系并且相同度大于或等于阈值α的两个对象才能划分在一个基本集中,在此基础上建立基于α相同度相似关系的ro