论文部分内容阅读
烟叶收购阶段,正确客观的划分烟叶等级既可提高烟农的种植积极性,又可保障卷烟企业的经济利益。现阶段的人工分级存在主观性强、人力和物力耗费大等缺点,针对同一片烟叶,不同的专家有可能将它划分到不同的等级。因此,客观、快速、高准确率的智能分级是迫切需要的。目前,烟叶智能分级的研究集中在基于烟叶图像和红外光谱进行分级两个方面。由于烟叶的光谱特征可以更好地反映含油量、色度、身份及成熟度等与烟叶等级密切相关的因素,所以本文基于光谱对烟叶分级进行了研究。烟叶智能分级系统的识别率和整体速度与所选择的分级模型和样本特征光谱的采集量存在很大的关系,为实现一个具有高识别率的实时烟叶智能分级系统本文主要进行了以下工作:1.烟叶光谱的采集、预处理和孤立样本的检测。利用型号为UV-3600的光谱仪采集642(13个等级)片烟叶的反射光谱;为降低基线漂移所带来的噪声和特征值间的差异对分级的影响,对光谱进行了归一化处理;由于可能存在错分类别的样本(孤立样本),所以需要对构建分级模型的样本训练集进行选择。本文分别利用夹角余弦距离、欧氏距离和相关系数法并通过统计分析选择合适的阈值检测各个等级中的孤立样本和确定用于建立分级模型的样本训练集。2.分级模型的构建以及K近邻算法的改进。分别构建支持向量机(SVM)、极限学习机(ELM)、K近邻(KNN)和加权K近邻等烟叶分级模型,将分级模型的识别率作为适应度函数,全光谱下ELM和SVM的测试集最优正确率分别为85.75%和91.02%。加权K近邻方法为:一种方法是每个等级中训练集的权重相同,为该等级样本个数的倒数。另一种方法是先找出K个近邻,加上与距离呈负相关的权重,通过计算每个等级的权重之和为烟叶进行定级,两种方法相结合的识别率可达90.77%。加权K近邻的分类效果优于传统K近邻,计算复杂度低于SVM和ELM,本文选用加权K近邻作为烟叶等级判断的分类器。3.基于聚类思想的特征初步筛选。同时考虑相同特征的类内离散度和类间离散度,构造判别特征好与坏的鉴别函数D,依据D值删除拐点右侧特征,在第6个拐点下取得最优分级效果,余下326个特征,测试集正确率由90.77%增加至94.59%,既提高了识别率又降低了特征的个数。4.深层特征的筛选。采用粒子群(BPSO)、遗传算法(GA)、相关系数分析(CC)进一步进行特征的筛选。BPSO取得较好的效果,特征数目由原来的451个减少到143个,这样采集光谱所耗费的时间可节省68.3%;识别率由原来的90.77%提高到93.69%,提高了2.92个百分点。