论文部分内容阅读
我国生活垃圾管理原则是“减量化、资源化、无害化”,即尽可能避免产生垃圾,对已经产生的垃圾尽可能回收利用,其次考虑垃圾焚烧处理,最后才考虑对垃圾进行填埋处理。然而,就目前而言,垃圾回收设施覆盖面不广且分类不细致,居民在垃圾分类方面主要有无法正确将垃圾进行分类、缺乏垃圾分类的意识和相关知识等问题。为此,本文提出智能可回收垃圾分类算法,该算法仅是根据拍照得到的垃圾图像信息便可自动识别该垃圾所属的类别。因此,智能垃圾分类算法一方面可以将可回收垃圾正确分类,另一方面也可以提高可回收垃圾的资源利用率。我国普遍存在的可回收物主要有废纸、废金属、废玻璃和废塑料等,因此本文首先是收集到塑料、金属、纸板、玻璃四类可回收垃圾的图像数据,由于收集图像的来源不同,采用Lanczos算法将数据统一处理为192×256×3大小的图像,再通过旋转、光线、对比、模糊等数据增强方式来扩大样本量。接着,将192×256×3大小的图像转为192×256大小的二维数组形式,即解释变量是矩阵形式的数据,再将数据集划分训练集和验证集。在训练集上,分别采用传统PCA、DFPCA和DFPFC三种降维方法对高维图像数据进行降维,并根据三种降维方法在训练集上训练出的参数对验证集数据进行降维。传统PCA降维方法先是将矩阵形式数据向量化再进行降维,没有考虑矩阵内在的结构,而DFPCA和DFPFC两种维数折叠降维方法是直接对矩阵值的解释变量进行降维,且降维后的解释变量仍是矩阵形式,从而可以很好的保留矩阵内在相关结构。相较于DFPCA降维方法,DFPFC降维方法利用了被解释变量的信息,属于有监督降维。三种降维方法在可回收垃圾数据上的分析结果表明,DFPFC的降维效果最优,其次是DFPCA降维方法,最后是传统PCA降维方法。最后,将三种降维方法降维后的数据向量化并作为可回收垃圾的解释变量,将可回收垃圾所属的类别塑料、金属、纸板、玻璃作为被解释变量,对这样的训练集数据建立LightGBM模型进行模型拟合,并在验证集上分别用PCA--LightGBM模型、DFPCA-LightGBM模型和DFPFC--LightGBM模型来评价模型的性能,结果表明DFPFC--LightGBM模型的分类效果最优,其宏平均精确率为0.93,宏平均召回率为0.80,宏平均F1值为0.85。因此,对于新来的一张可回收垃圾图像,可用DFPCF--LightGBM模型来判别该垃圾所属类别的概率。这也表明对于可回收垃圾图像数据来说,用矩阵值进行降维再分类的效果要优于向量化降维再分类的效果,从而进一步提升可回收垃圾识别的准确率,提高资源利用率。