使用特征分辨率和差别对象对集的特征选择

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zhangyan820923
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是文本分类的关键步骤之一,所选特征子集的优劣直接影响文本分类的结果。首先简单分析了几种经典的特征选择方法,总结了它们的不足,然后提出了特征分辨率的概念,并提出了一个基于差别对象对集的属性约简算法,最后把该属性约简算法同特征分辨率结合起来,提出了一个新的特征选择方法。该方法首先利用特征分辨率进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明此种特征选择方法效果良好。
其他文献
采集了南京市城郊零散菜地土壤和青菜配对样品各18个,用原子吸收光谱仪测定了其中铜、锌、铅、镉的含量,结果表明:南京市城郊菜地土壤中Cu、Zn、Pb、Cd全量高于农区菜地土壤,
由于流数据无限增长的特点,系统无法在内存中保存所有扫描过的流数据,因此数据流处理的关键是建立流数据的概要结构,以便随时能根据该结构提供数据流的近似处理结果,将重点讨论数
通过AnsoflHFSS电磁软件对天线模型参数进行仿真和优化,设计了一款新型电磁偶板子宽带天线。该天线阻抗带宽2-4GHz、前后比达10dB,体积小。测试结果表明其性能指标满足设计需求
目前高校小学教育专业课程设置结构彼此迥然相异的主要原因在于四个方面:小学教育专业的职业性在课程中没有得到体现;基础教育课程的综合化要求与师范课程综合化的要求相互混
流媒体(Streaming Media)是一种新兴的网络传输技术.由于其允许网络浏览者不必等到整个多媒体文件下载完成就可以从网上一边下载一边收看音视频多媒体节目,所以受到了几乎所
推导逆瑞利分布的密度函数和分布函数的MLE和UMVUE,并给出估计量r阶矩的精确表达式。对估计量的均方误差和变异系数做渐进展开,在大样本下给出逆瑞利分布有效估计的判断条件
迷惑集壶菌(Synchytrium decipiens)是三籽两型豆上的一种专性内寄生菌,侵染三籽两型豆的豆荚和假根,形成不规则瘤状凸起,瘤状体内着生许多病原菌的营养体,阻碍导管中水分和无
针对番茄茎叶自然发酵速率较慢的问题,采用与剩余污泥混合发酵(番茄茎叶与污泥挥发性固体质量比为1:2)调控底物营养结构,同时接种0.1 g/m L颗粒污泥弥补体系产甲烷菌微生物不足的方法,不仅使番茄茎叶的去除率达到95%以上,而且显著提高有机物发酵的沼气产率至263 m L/g(提高7.5倍),沼气中甲烷体积分数也相应提高至64.5%。该发酵方法不仅达到了以废治废的目的,而且实现了资源利用最大化。
建立二维数学模型,对比研究了低雷诺数下(0 ~ 100)壁面加热对直径分别为2 cm、20 μm及2μm的微圆柱漩涡脱落的影响规律.深入探讨了直径、壁面与流体温差对圆柱绕流中漩涡生长和