论文部分内容阅读
为更好的预测二手车价格,根据二手车数据集,将随机森林和XGBoost算法相结合进行预测。首先对原始数据进行数据预处理,对奇异值与缺失值进行预处理以及数据的结构化处理。再利用随机森林算法进行变量选择,根据随机森林输出的得分排序选择分数不为零的变量作为预测价格的特征变量。再将XGBoost,GBDT和lightGBM三种算法进行网格搜索寻到最优参数,对比后选用XGBoost算法进行二手车价格预测得到最优的二手车价格预测结果。