论文部分内容阅读
摘 要:以实际工程为例,基于数据挖掘流程,介绍了应用模糊数学法对架空线路工程单位造价预测的计算过程,其计算结果与实际工程单位造价相比,误差在工程允许的精度范围内,以供广大工程造价管理人员参考。
关键词:架空线路工程;数据挖掘流程;工程造价;模糊数学
电网建设规模不断壮大,电网企业面临着巨大的市场压力,科学有效的造价管理不仅能够为企业带来良好的经济收益,还能够提高企业的市场竞争力。在造价管理的过程中,快速准确的造价预测可以辅助投资决策,指导招投标报价,也能够有效控制工程花费的成本。本文基于数据挖掘的流程,结合北京市各地区架空线路工程历史数据,介绍运用模糊数学的方法对架空线路工程单位造价进行预测的计算过程。
一、架空线路工程数据准备
(一)数据收集
本文从北京电力公司收集了39项架空线路工程历史造价数据以供研究,其来源是这39项工程的可行性研究报告及相应概算。工程造价涉及属性指标集合果直接利用未处理的数据进行数据挖掘,会引起运行的时间和空间剧增,输出的结果和提取的规则不准确,给造价预测带来一定的困难。所以,在构建单位造价预测模型之前,需要对数据进行预处理。
(二)数据预处理
首先,采用箱形图“清洗”数据,光滑噪声并识别离群点,解决数据中的不一致性。本文利用SPSS数学统计软件对单位长度工程造价这一组数据分电压等级绘制箱形图,其处理结果如图1-1所示。由图可知,工程样本12和24的架空线路工程单位造价出现异常,所以在后续的数据挖掘中应该将两个工程样本剔除。
然后,采用通径分析法对数据进行约简,消除冗余数据。根据收集的历史造价数据,利用SPSS软件求得单位造价y与xi(i=1,2,...,11)的回归方程:
则xi与y直接通径系数Piy可以用标准差表示,即Piy= ,间接通径系数Pij=rij+Pjy,经计算可得每个自变量对单位长度造价的直接作用与间接作用数值,并进行排序。根据直接作用与间接作用的绝对值均大于0.15的保留原则(一般大于0.1即可保留,本文为更准确,取0.15),对自变量进行冗余数据的剔除,保留结果如表1-1所示。
通过数据预处理,最终得到五个自变量,分别是线路折单长度、耐张转角塔指标、塔材指标、基础混凝土量指标、基础钢材量指标。
二、基于模糊数学的架空線路工程单位造价预测模型构建
从经过预处理的历史数据中,选取工程—为建立单位造价预测模型的建模数据,工程为待预测工程的数据,通过与10个已建工程的对比计算,得出其预测单位投资,将其与实际单位投资数据比较,判断其预测的准确性。相关数据如表1-2所示:
(一)特征因素隶属度的确定
采用最小最大标准化方法对工程历史数据进行归一化处理,把它们转化到[0,1]之间,可以得到如下的模糊关系矩阵:
(二)特征因素权重的确定
邀请工程造价领域的专家,对影响架空线路工程的五个特征因素线路折单长度、耐张转角塔指标、塔材指标、基础混凝土量指标、基础钢材量指标两两比较进行评分,取其打分平均值后,利用MATLAB计算各指标在整个体系中的权重,可以得到模糊关系矩阵A:
然后再采用“和”法计算权向量,即可得到权重集合W。
W=(0.253,0.214,0.207,0.183,0.143)
(三)贴近度的确定
运用最大最小贴近度计算法则,计算待估工程B与A1已建工程的贴近度:
同理可求出:
(四)单位造价的确定
根据择近原则:α1≥α2≥α3,可得:α1=0.64,α2=0.598,α3=0.531,选取A7 A5和A10作为已知典型工程,其对应的架空线路工程单位造价为:
F1=94.52,F2=73.65,F3=116.92
又根据:
(1)
其中,m表示工程模糊集合中元素的个数,文中取10;T估,Tα1,Tα2,Tα3分别表示各工程模糊关系系数和与其中模糊关系系数和最大值的比例。
经计算得:Tα1=0.83,Tα2=0.80,Tα3=1,T估=0.94
代入公式(1)可得:F=95.03万元/千米
将调整后的单价与实际工程单价作对比,可得到误差率:
三、结语
架空线路工程B的实际单位造价为101.57万元/千米,应用该模型确定的估算价误差为6.44%,可见应用该法进行架空线路工程单位造价预测是可行的,精度基本满足工程要求。
关键词:架空线路工程;数据挖掘流程;工程造价;模糊数学
电网建设规模不断壮大,电网企业面临着巨大的市场压力,科学有效的造价管理不仅能够为企业带来良好的经济收益,还能够提高企业的市场竞争力。在造价管理的过程中,快速准确的造价预测可以辅助投资决策,指导招投标报价,也能够有效控制工程花费的成本。本文基于数据挖掘的流程,结合北京市各地区架空线路工程历史数据,介绍运用模糊数学的方法对架空线路工程单位造价进行预测的计算过程。
一、架空线路工程数据准备
(一)数据收集
本文从北京电力公司收集了39项架空线路工程历史造价数据以供研究,其来源是这39项工程的可行性研究报告及相应概算。工程造价涉及属性指标集合果直接利用未处理的数据进行数据挖掘,会引起运行的时间和空间剧增,输出的结果和提取的规则不准确,给造价预测带来一定的困难。所以,在构建单位造价预测模型之前,需要对数据进行预处理。
(二)数据预处理
首先,采用箱形图“清洗”数据,光滑噪声并识别离群点,解决数据中的不一致性。本文利用SPSS数学统计软件对单位长度工程造价这一组数据分电压等级绘制箱形图,其处理结果如图1-1所示。由图可知,工程样本12和24的架空线路工程单位造价出现异常,所以在后续的数据挖掘中应该将两个工程样本剔除。
然后,采用通径分析法对数据进行约简,消除冗余数据。根据收集的历史造价数据,利用SPSS软件求得单位造价y与xi(i=1,2,...,11)的回归方程:
则xi与y直接通径系数Piy可以用标准差表示,即Piy= ,间接通径系数Pij=rij+Pjy,经计算可得每个自变量对单位长度造价的直接作用与间接作用数值,并进行排序。根据直接作用与间接作用的绝对值均大于0.15的保留原则(一般大于0.1即可保留,本文为更准确,取0.15),对自变量进行冗余数据的剔除,保留结果如表1-1所示。
通过数据预处理,最终得到五个自变量,分别是线路折单长度、耐张转角塔指标、塔材指标、基础混凝土量指标、基础钢材量指标。
二、基于模糊数学的架空線路工程单位造价预测模型构建
从经过预处理的历史数据中,选取工程—为建立单位造价预测模型的建模数据,工程为待预测工程的数据,通过与10个已建工程的对比计算,得出其预测单位投资,将其与实际单位投资数据比较,判断其预测的准确性。相关数据如表1-2所示:
(一)特征因素隶属度的确定
采用最小最大标准化方法对工程历史数据进行归一化处理,把它们转化到[0,1]之间,可以得到如下的模糊关系矩阵:
(二)特征因素权重的确定
邀请工程造价领域的专家,对影响架空线路工程的五个特征因素线路折单长度、耐张转角塔指标、塔材指标、基础混凝土量指标、基础钢材量指标两两比较进行评分,取其打分平均值后,利用MATLAB计算各指标在整个体系中的权重,可以得到模糊关系矩阵A:
然后再采用“和”法计算权向量,即可得到权重集合W。
W=(0.253,0.214,0.207,0.183,0.143)
(三)贴近度的确定
运用最大最小贴近度计算法则,计算待估工程B与A1已建工程的贴近度:
同理可求出:
(四)单位造价的确定
根据择近原则:α1≥α2≥α3,可得:α1=0.64,α2=0.598,α3=0.531,选取A7 A5和A10作为已知典型工程,其对应的架空线路工程单位造价为:
F1=94.52,F2=73.65,F3=116.92
又根据:
(1)
其中,m表示工程模糊集合中元素的个数,文中取10;T估,Tα1,Tα2,Tα3分别表示各工程模糊关系系数和与其中模糊关系系数和最大值的比例。
经计算得:Tα1=0.83,Tα2=0.80,Tα3=1,T估=0.94
代入公式(1)可得:F=95.03万元/千米
将调整后的单价与实际工程单价作对比,可得到误差率:
三、结语
架空线路工程B的实际单位造价为101.57万元/千米,应用该模型确定的估算价误差为6.44%,可见应用该法进行架空线路工程单位造价预测是可行的,精度基本满足工程要求。