采用特征分辨率和等价类相关矩阵的特征选择

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:xujc8639
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是文本分类的关键步骤之一,所选特征子集的优劣直接影响文本分类的结果。首先分析了词频和文档频并在此基础上对文档频进行优化。然后又以此为基础提出了特征分辨率并先用它初选文本特征。紧接着又把粗糙集引入进来并给出了一个基于等价类相关矩阵的属性约简算法,以此来进一步消除冗余特征。仿真结果表明上述方法无论是在精确度和召回率方面,还是时间性能及平均分类精度方面,都具有一定的优势。
其他文献
一部分急性脑梗死患者可并发脑心综合征,往往导致病情加重,威胁患者生命,影响患者预后。回顾分析我院近1a来收治的36例急性脑梗死并发脑心综合征患者的临床资料,现报告如下。
由于土壤活性有机碳可以在土壤全碳变化之前反映土壤因管理措施和环境引起的微小的变化,又直接参与土壤微生物化学转化过程,对土壤碳平衡和土壤化学、土壤肥力保持具有重要意义。因此,采用原状土芯(intact core)法,探讨了4种退耕还林模式———光皮桦(Betula luminifera)与扁穗牛鞭草(Hemarthria compressa)复合模式、扁穗牛鞭草草地、柳杉(Cryptameriafo
以套管-水泥环-地层为研究对象,在理想状况下,受均匀内压、均匀地应力、温度载荷等共同作用时的承载特性进行分析。采用PLANE183平面应变单元,对套管-水泥环-地层进行单元离散,建
2006年6月至2007年5月对青岛湾潮间带泥沙质和沙质沉积物中的小型底栖生物及环境因子进行了周年逐月采样。研究发现,小型底栖生物在两个底质中的数量和分布上差异极大,泥沙质中的年平均丰度高达(4853±1292)个/10 cm2,沙质中为(1528±569)个/10 cm2,生物量则分别为(3186.9±1993.4)μg干重/10 cm2和(1601.5±786.2)μg干重/10 cm2。在季
2008年11-12月和2009年4-5月对贺兰山野化牦牛的冬季和春季食性进行了分析,在其分布的哈拉乌沟收集冬季粪样500 g,春季粪样498 g,利用粪便显微分析法分析贺兰山牦牛取食植物的种类组成和比例,结果表明,冬季牦牛取食11科20种(属)植物,主要取食禾本科(59.10%)和菊科(26.05%)植物,其中针茅(35.86%)、冷蒿(23.96%)、冰草(8.28%)、莎草(7.60%)、虎
本文探讨了如何充分利用网络资源来管理机房以及机房日常维护中经常碰到的问题及解决方法。
提出一种针对车牌识别算法要求的车牌图像质量综合评价方法。其中根据车牌识别算法的普遍要求,归纳出了四种车牌图像质量评价因子:亮度偏移、亮度分布一致性、对比度、清晰度。最后使用主成份分析方法将四种评价因子综合起来建立得到对车牌图像的总体质量评价标准。采用这个评价标准,可以在无参考的情况下对单张车牌图像给出质量评价,为降低系统误差提供量化的依据,从而到达为识别算法提供高质量的输入图像的目的。