论文部分内容阅读
大数据时代的到来,我国经济进入快速发展阶段,汽车市场欣欣向荣,越来越多的消费者出于多方面考虑,开始接受二手车。到2021年底,国内二手车销售总数达到1758.51万辆,销售收入8888.4亿元。销售总数和销售收入的上升带动了二手车产业的发展,也对二手车价值评估提出了更高的要求。然而,在现实社会中,二手车市场各地区发展不平衡,而且由于缺乏相关交易数据,限制了三种传统评估方法的应用。评估信息不对称,评估过程成本高。因此,出于国内二手车市场供需考虑,急需一种适合我国的二手车价值评估方法。随机森林模型作为一种机器学习模型,在数据处理中具有消除特定噪声和缺失数据样本的独特优势。因此,本文将随机森林模型引入二手车价值评估研究。首先,根据属性的不同将16个特征变量分为7个实体变量、6个功能变量和3个市场变量,并进行赋值。其次,赋值后将数据导入随机森林模型中,根据均方误差的平均递减程度,对16个特征变量按其重要性进行排序和选择,建立了评估二手车价值的特征变量体系,体系共有11个特征变量。再者,将样本数据以8:2的比值划分为训练数据集和测试数据集,确定随机森林模型的2个重要参数:单棵决策树每次生长时抽取的随机变量数(mtry)最优值和单株生长中决策树数(ntree)的最优值。然后,根据得到的2个最优值基于测试集建模,选取模型的拟合优度R~2、平均相对误差MRE、平均绝对误差MAE和均方根误差RMSE等指标验证模型运行的有效性,对二手车的模型估计值和实际值的误差分析验证模型评估的准确性。经计算和分析结果表明,该模型运行良好,拟合优度达到92.21%。评价值与实际值的误差主要在5%以内,最终得出随机森林模型非常适合于大量二手车价值评价。同时,其仿真数据表明对二手车价值评估影响较大的因素有新车价格、排量、功率和驱动类型,影响最小的是车辆的过户次数。最后,分别用随机森林算法和成本法对重庆市3辆已交易的二手车进行案例比较,发现随机森林算法的平均误差率小于5%,进一步又证明了该模型在价值评估中的适合性。本文在随机森林原理及随机森林在二手车价值评估的适用性的基础上,建立了二手车价值评估模型。此模型不仅可以减少评估成本,提升评估效率,而且能够适应市场需求。为大量二手车的价值评估提供了一种新的思路。该模型可用于不同品牌和不同配置的车辆的验证研究。评估时只需要将待评估汽车的信息数据量化后,输入随机森林模型中,就能立即获得评估结果。评价过程简单,模型具备一定的实用性。