【摘 要】
:
在高维数据分类中,针对多重共线性、冗余特征及噪声易导致分类器识别精度低和时空开销大的问题,提出融合偏最小二乘(Partial Least Squares,PLS)有监督特征提取和虚假最近邻
【机 构】
:
重庆理工大学数学与统计学院,重庆科技学院,西安石油大学电子工程学院
论文部分内容阅读
在高维数据分类中,针对多重共线性、冗余特征及噪声易导致分类器识别精度低和时空开销大的问题,提出融合偏最小二乘(Partial Least Squares,PLS)有监督特征提取和虚假最近邻点(False Nearest Neighbors,FNN)的特征选择方法:首先利用偏最小二乘对高维数据提取主元,消除特征之间的多重共线性,得到携带监督信息的独立主元空间;然后通过计算各特征选择前后在此空间的相关性,建立基于虚假最近邻点的特征相似性测度,得到原始特征对类别变量解释能力强弱排序;最后,依次剔除解释能力弱的特征,构造出各种分类模型,并以支持向量机(Support Vector Machine,SVM)分类识别率为模型评估准则,搜索出识别率最高但含特征数最少的分类模型,此模型所含的特征即为最佳特征子集.3个数据集模型仿真结果均表明,由此法选择出的最佳特征子集与各数据集的本质分类特征吻合,说明该方法有良好的特征选择能力,为数据分类特征选择提供了一条新途径.
其他文献
采用原子吸收光谱法测定了麻竹笋(Dendrocalamus latiflorus)及立地土壤中铜、铁、锌、锰、钙和镁等元素的含量.结果表明,麻竹笋中钙、镁、锌、铁元素含量较高,其中镁含量可
谭家健先生《叙事比论》以记得事详便是优点,似乎记得事详就等于文学性强,这是偏见,文学性是由多种因素构成和影响的一个复杂的系统,绝不能仅仅以记得事详或写得字多为唯一判
在课堂教学中,教师需要有“激情”,怀着满腔热情进入课堂,把知识和技能传授给学生。
研究佳木斯大学临床医学院骨科应用PBL教学模式培养高素质医学人才实践,探讨21世纪教育理念——终身学习、21世纪——2030世界未来教育发展新理念、PBL教学模式应用佳木斯大学
大型复杂化工程过程控制中,常规的集中式控制方式不利于实时性、灵活性和容错控制。而采用多预测控制器协调的分布式控制是解决这一问题的有效方法:。针对子系统间的动态耦合
针对污水处理中某些生物参数难以在线测量的情况,本文提出了一种基于小波核的多尺度最小二乘小波支持向量机软测量建模方法:。首先,选取墨西哥草帽小波函数作为最小二乘支持向量机的核函数,进而设计出多尺度小波最小二乘支持向量回归机(MW-LSSVR)。然后利用该支持向量机和出水水质参数特性建立混合软测量模型,实现对出水BOD浓度、COD浓度在线预测。通过在实际污水处理过程的应用,结果:表明本建模方法:具有较
摘要:针对质子交换膜燃料电池中质子交换膜两侧的压力差易受负载电流变化的影响及压力差在常规控制中输出响应幅值过大等不足,本文提出了基于模糊推理的柔化系数在线调整改进
针对苹果糖度近红外光谱数据的特点,分析了基于BP神经网络和偏最小二乘PLS的苹果糖度定量预测模型建立方法:,将平均影响值方法:(mean impact value)引入到近红外波长选取的过
针对铜冶炼过程中的能耗难以预测的问题,提出基于支持向量回归的铜冶炼节能过程参数优化学习方法:,首先分析影响铜能耗的各种参数,然后利支持向量回归算法对输入参数和输出能
涤纶纺丝生产过程中熔体输送环节具有机理复杂、受诸多因素影响、拥有多种产品性能指标等特点,对其进行工艺优化较为困难,目前往往凭借生产经验,缺乏一定的理论指导。熔体输