论文部分内容阅读
[摘 要]将多类的F-score作为特征选择准则,分别用支持向量机和BP神经网络评估所选特征子集的有效性。将该方法运用于泡沫浮选特征选择上,实验证明支持向量机有比BP神经网络更好的稳定性,能够选择出较好的特征。
[关键词]泡沫图像特征;F-score;SVM;特征选择
中图分类号:TP391.41 文献标识码:A 文章编号:1009-914X(2013)36-0391-01
引言
铜浮选首选槽的状况对于整个浮选流程有着重要的意义。现场操作工人通过观察浮选槽表面的泡沫,作为判别现场工况的重要方法。为减轻现场工人工作量,引入了计算机视觉技术,用计算机采集的现场泡沫图像,根据提取出来的特征来进行判断。
特征选择算法主要划分为两大类:Filter方法和Wrapper方法。Filter方法独立于分类器,训练速度较快;Wrapper方法依赖于分类器,以分类器的分类准确率评价所选特征子集的性能,选择对分类有重要贡献的特征,需要较长的训练时间,分类性能优于Filter方法。近年来出现了结合Filter和Wrapper方法各自优点的混合特征选择方法。本文采用的是先用得出各个特征Filter方法的值,即F-score值,之后再排序,再用SVM或BP神经网络选择最优的特征个数。
但是,由于泡沫图像特征的选择是根据人为知识经验,其准确性不能够很好地得到保证,因此如何选择合适的图像特征成为本文研究的重点。
1 泡沫特征
本文选用泡沫浮现现场提取的12个现场泡沫特征,重要的特征有:泡沫承载率,尺寸,红色分量,色调等[1][2]。
由于这些特征不能很明显的表征出三种类型的特征,为消除人为选择的不准确性,本文基于模式相似性测度的标准,并且结合分类器给泡沫的特征选择提供可靠的依据。
2 特征选择方法
特征选择是从众多特征中挑选出那些对分类识别最有效的特征,从而压缩特征空间维数。F-score方法是一种衡量特征在两种类别之间分辨能力的方法,该方法可以实现最有效特征的选择。谢娟英等将此方法扩展到多类F-score
其中:,分别为第i个特征在整个数据集上的平均值,在j类数据上的平均值;为第k个正类样本点的第i个特征的特征值。F值越大,此特征的辨别力越强[3]。
算出各特征的F-score值之后再排序,用支持向量机或BP神经网络来评价特征个数选择的好坏,以此来验证选取特征的有效性。图1为总体框图。
3 支持向量机
本文选用的是由台湾大学林智仁(Lin Chih-Jen)副教授等[4]开发设计出来的一个简单、易于使用和快速有效的应用工具软件LIBSVM进行仿真,支持向量机选用默认的设置。
4 仿真实现
本文把泡沫分为三种类型,正常,水化,粘性。从各种视频中提取出相应的特征,各15组。分别选取各典型视频10组特征数据作为训练样本,5组作为测试样本。
首先运用F-score方法把特征进行排序,图2为各特征的F-score值。其F-score特征排序为 2,1,3,4,8,9,7,12,6,5,10。再根据SVM评估特征子集分类效果,图3为支持向量机评估特征子集分类正确率。根据BP神经网络评估特征子集分类效果,图4为神经网络评估特征子集分类正确率。
5 分析与结论
支持向量机分类,当特征个数为5,6时,能够达到很好的分类效果。即选择编号为2,1,3,4,8的特征,能够达到比较理想的效果。
BP神经网络分类经过重复仿真验证,可能出现不同的结论,可重复性差,对于特征个数的选择没有很一致的结论。
6 结束语
实验证明,支持向量机有比BP神经网络更好的稳定性,分类正确率。
此方法为泡沫浮选过程的特征选择提供了比较好的方法。为判断工况,抓住图像主要的特征准确判断工况,提供了较可靠的依据。由于现场工况复杂,该方法存在一定的局限性,限定在特定的工況下,所以方法的可扩展性有待更加深入的研究。
参考文献
[1] 瓜里尼M.,左焕莹译.图像处理技术用于评估矿物浮选过程的质量[J].国外金属矿选,1999,36(12):38~41.
[2] 阳春华,周开军,牟学民等.基于计算机视觉的浮选泡沫颜色及尺寸测量方法[J],仪器仪表学报,2009,30(4):717~721.
[3] 谢娟英等.基于改进的F-score与支持向量机的特征选择方法[J].计算机应用,2010,30(4):993-996
[4] http://www.csie.ntu.edu.tw/~cjlin/
[关键词]泡沫图像特征;F-score;SVM;特征选择
中图分类号:TP391.41 文献标识码:A 文章编号:1009-914X(2013)36-0391-01
引言
铜浮选首选槽的状况对于整个浮选流程有着重要的意义。现场操作工人通过观察浮选槽表面的泡沫,作为判别现场工况的重要方法。为减轻现场工人工作量,引入了计算机视觉技术,用计算机采集的现场泡沫图像,根据提取出来的特征来进行判断。
特征选择算法主要划分为两大类:Filter方法和Wrapper方法。Filter方法独立于分类器,训练速度较快;Wrapper方法依赖于分类器,以分类器的分类准确率评价所选特征子集的性能,选择对分类有重要贡献的特征,需要较长的训练时间,分类性能优于Filter方法。近年来出现了结合Filter和Wrapper方法各自优点的混合特征选择方法。本文采用的是先用得出各个特征Filter方法的值,即F-score值,之后再排序,再用SVM或BP神经网络选择最优的特征个数。
但是,由于泡沫图像特征的选择是根据人为知识经验,其准确性不能够很好地得到保证,因此如何选择合适的图像特征成为本文研究的重点。
1 泡沫特征
本文选用泡沫浮现现场提取的12个现场泡沫特征,重要的特征有:泡沫承载率,尺寸,红色分量,色调等[1][2]。
由于这些特征不能很明显的表征出三种类型的特征,为消除人为选择的不准确性,本文基于模式相似性测度的标准,并且结合分类器给泡沫的特征选择提供可靠的依据。
2 特征选择方法
特征选择是从众多特征中挑选出那些对分类识别最有效的特征,从而压缩特征空间维数。F-score方法是一种衡量特征在两种类别之间分辨能力的方法,该方法可以实现最有效特征的选择。谢娟英等将此方法扩展到多类F-score
其中:,分别为第i个特征在整个数据集上的平均值,在j类数据上的平均值;为第k个正类样本点的第i个特征的特征值。F值越大,此特征的辨别力越强[3]。
算出各特征的F-score值之后再排序,用支持向量机或BP神经网络来评价特征个数选择的好坏,以此来验证选取特征的有效性。图1为总体框图。
3 支持向量机
本文选用的是由台湾大学林智仁(Lin Chih-Jen)副教授等[4]开发设计出来的一个简单、易于使用和快速有效的应用工具软件LIBSVM进行仿真,支持向量机选用默认的设置。
4 仿真实现
本文把泡沫分为三种类型,正常,水化,粘性。从各种视频中提取出相应的特征,各15组。分别选取各典型视频10组特征数据作为训练样本,5组作为测试样本。
首先运用F-score方法把特征进行排序,图2为各特征的F-score值。其F-score特征排序为 2,1,3,4,8,9,7,12,6,5,10。再根据SVM评估特征子集分类效果,图3为支持向量机评估特征子集分类正确率。根据BP神经网络评估特征子集分类效果,图4为神经网络评估特征子集分类正确率。
5 分析与结论
支持向量机分类,当特征个数为5,6时,能够达到很好的分类效果。即选择编号为2,1,3,4,8的特征,能够达到比较理想的效果。
BP神经网络分类经过重复仿真验证,可能出现不同的结论,可重复性差,对于特征个数的选择没有很一致的结论。
6 结束语
实验证明,支持向量机有比BP神经网络更好的稳定性,分类正确率。
此方法为泡沫浮选过程的特征选择提供了比较好的方法。为判断工况,抓住图像主要的特征准确判断工况,提供了较可靠的依据。由于现场工况复杂,该方法存在一定的局限性,限定在特定的工況下,所以方法的可扩展性有待更加深入的研究。
参考文献
[1] 瓜里尼M.,左焕莹译.图像处理技术用于评估矿物浮选过程的质量[J].国外金属矿选,1999,36(12):38~41.
[2] 阳春华,周开军,牟学民等.基于计算机视觉的浮选泡沫颜色及尺寸测量方法[J],仪器仪表学报,2009,30(4):717~721.
[3] 谢娟英等.基于改进的F-score与支持向量机的特征选择方法[J].计算机应用,2010,30(4):993-996
[4] http://www.csie.ntu.edu.tw/~cjlin/