论文部分内容阅读
多样本多维数据是指由大量的具有多维属性的样本组成的数据集。此类数据普遍存在于材料、医疗、航空航天、电力电子等领域,通过挖掘和分析这些数据,构建预测模型,可推演出上述领域中某个指定目标变量的可能性结果。然而,尽管近年来大数据分析与预测理论获得了较大发展,但因上述多样本多维数据具有模糊性、不确定性、耦合性和多维属性特性,直接采用现有的机器学习算法和统计分析方法,较难获得高预测精度。本课题的研究目的是提出多样本多维数据分析与智能预测理论与方法,并应用它解决牙周炎疗效的分类预测问题,也为其他领域的多样本多维数据挖掘与预测提供可借鉴的方法。本文的主要创新性工作包括:
(1)在分析一维云的基础上,为了适应数据多维度的特性,分别提出了二维云模型和多维云模型构建方法,给出了二维和多维前件云产生云滴的算法过程和二维与多维单规则发生器的算法步骤,解决了多样本多维数据的模糊性和不确定性引发的预测精度低的问题。
(2)在详细分析Xgboost、PCA和BP神经网络的优缺点的基础上,提出了Xgboost-PCA-BPNN组合预测算法,降低了多样本多维数据的耦合性和多维性对预测性能的影响,提升了预测准确度。
(3)在分析北京某口腔医院牙周炎治疗过程4.5万例位点数据的基础上,分别将所提出的多维云模型和Xgboost-PCA-BPNN组合预测算法应用于牙周炎治疗效果预测,获得了较好的预测效果。测试结果表明,Xgboost-PCA-BPNN组合预测算法精度达82%,优于多维云模型和其他机器学习方法,如逻辑回归、Xgboost和Xgboost-逻辑回归组合算法。
(1)在分析一维云的基础上,为了适应数据多维度的特性,分别提出了二维云模型和多维云模型构建方法,给出了二维和多维前件云产生云滴的算法过程和二维与多维单规则发生器的算法步骤,解决了多样本多维数据的模糊性和不确定性引发的预测精度低的问题。
(2)在详细分析Xgboost、PCA和BP神经网络的优缺点的基础上,提出了Xgboost-PCA-BPNN组合预测算法,降低了多样本多维数据的耦合性和多维性对预测性能的影响,提升了预测准确度。
(3)在分析北京某口腔医院牙周炎治疗过程4.5万例位点数据的基础上,分别将所提出的多维云模型和Xgboost-PCA-BPNN组合预测算法应用于牙周炎治疗效果预测,获得了较好的预测效果。测试结果表明,Xgboost-PCA-BPNN组合预测算法精度达82%,优于多维云模型和其他机器学习方法,如逻辑回归、Xgboost和Xgboost-逻辑回归组合算法。