首页 > 工程预算造价 > 工程造价知识 >

建筑工程造价聚类分析

来源:代做工程预算    时间:2022-12-25

建筑工程的造价预测是可行性研究和成本管理的重要内容,直接影响项目的投资决策。由于前期缺乏详细信息,因此传统的预测方法主要是单位面积指标法,预测的局限性较大、可靠性不高。

为了解决建筑工程造价预测问题,研究人员基于已有工程数据提出了许多预测模型。基于最小二乘法的多元线性回归模型,由于估算速度快、建模过程简单,得到研究者广泛应用。由于线性回归模型存在ARCH效应、共线性等问题,因此不少学者利用GARCH模型、主成分回归、ARIM模型等提出了改良的回归模型。

近年来神经网络技术得到普及,不少研究者利用灰色关联神经网络、BP神经网络、RBF神经网络等建立了工程造价预测模型,得到了不错的预测效果,但是神经网络也存在建模过程复杂,训练样本数量要求较高等问题。为了解决神经网络算法的不足,不少学者利用支持矢量机(SVM)、最小二乘支持矢量机(LS-SVM)建立了模型,解决了工程造价数据的混沌性和时变性问题。另外,上述预测模型考虑的因素主要包括建筑面积、基础形式、层数、门窗率等,均未考虑地区差异的影响。

由于我国不同地区经济发展水平、人力成本、物料成本的差异很大,导致各地区建筑工程造价有很大的区别,但是目前缺乏相关的研究。上述研究要么采用同一地区的样本建立预测模型,得到的模型只适用于当地;要么笼统地采用不同地区的样本建立预测模型,模型的精度受到样本数量的制约。为了解决工程造价的地区差异问题,本文利用全国30个省会城市和直辖市(不包括港澳台和西藏)的居住建筑工程造价数据,利用聚类分析将城市划分为不同的类,在此基础上建立多元线性回归模型,加入地区因子作为影响因素,在保证模型预测精度的同时确定建筑工程造价的地区差异。

1居住建筑工程造价的聚类分析

本文采用系统聚类法对国内30个不同省市的居住建筑工程造价进行聚类分析。系统聚类法的基本思想如下:将n个样本各自作为一类,并规定样本之间的距离以及类与类之间的距离,将距离最近的两类合并为一个新类(即并类);然后重新计算新类与其他类的距离,重复并类过程,直到所有样本合并成一类,最后形成聚类树形图。选择何种工程造价指标作为聚类分析的依据,影响到地区类别划分的准确性。建筑工程总造价包括基本的6个部分:建筑工程、装饰工程、给排水工程、采暖通风工程、强电工程和弱电工程,如果以总造价指标进行聚类分析,那么会存在以下问题:上海虽然人工费和材料费较高,但是居住建筑不需要采暖工程,因此单位建筑面积综合造价与济南等北方城市相仿,这样上海和济南同为一类并不具有可解释性和实际的意义。

而“建筑工程”是建筑造价的基本单元,因此本文仅针对建筑工程的造价进行聚类分析,装饰工程等其余五项由于不同项目采用的标准差异很大,聚类结果不具有解释性,不在分析范围内。本文的聚类分析样本选自“广联达指标网”,来源于全国30个省会城市和直辖市(由于数据不全,不包括港澳台和西藏)的居住工程项目实际经济指标。聚类方法采用上述的可变类平均法进行聚类。最终,通过不一致性系数将30个省市分为四类,第一类地区:北京、天津、上海;第二类地区:江苏、浙江、福建、湖北、广东、海南、陕西、青海;第三类地区:河北、内蒙古、辽宁、江西、河南、四川;第四类地区:山西、吉林、黑龙江、安徽、山东、湖南、广西、重庆、贵州、云南、甘肃、宁夏、新疆。

2居住建筑工程造价预测模型的实证研究

2.1变量描述本文选择14个居住建筑工程造价的影响因素作为回归模型的自变量。其中,有8项定量指标:地上建筑面积、地下建筑面积、地上层数、地下层数、地上层高、地下层高、门窗数量、当年工程造价指数;有6项定性指标:基础类别、桩基类别、结构形式、抗震等级、施工环境、地区类别。本文选择单位面积建筑工程造价作为因变量。表中,定量指标直接采用选择样本的实际数值,定性指标采用两元虚拟和分等赋值的量化方法。两元虚拟变量为施工环境,施工环境优良的为1,施工环境较差则为0。其余均为分等赋值变量。地区类别:1代表第一类地区,2代表第二类地区,3代表第三类地区,4代表第四类地区。

2.2实证方法本文选择主成分分析法进行参数估计,以解决传统线性回归方法存在的共线性问题。具体程序如下:(1)首先我们对变量进行标准化处理,以解决不同变量的量纲和单位的差别,在此调用MATLAB的ZSCORE函数进行标准化。(2)主成分分析。利用MATLAB的主成分工具箱进行主成分分析,由相关系数矩阵得到主成分、特征值、贡献率及累计贡献率,如表2所示。(3)选择累计贡献率达到90.0125%的前4个主成分因子作为模型自变量,各因子与各变量的权重,如表3所示。(4)利用3个主成分因子对模型进行线性回归分析,模型的估计方法为最小二乘法,最终结果如式1和式2所示。(5)对模型估计结果进行检验,包括显著性检验、共线性检验、异方差检验、自相关检验和残差正态性检验,如表4所示。

3实证研究结果及检验

将4个主成分因子作为自变量,单位面积建筑工程造价作为因变量,对模型进行线性回归分析。模型的估计方法为最小二乘法。据此得到主成分回归模型如下:P=0.001+0.2634F1-0.2858F2-0.1730F3+0.3582F4(1)其中,P为单位面积建筑工程造价的无量纲,F1~F4为4个主成分因子。将表4中主成分权重代入式1,可得x1~x14变量与P的回归模型如下:(1)显著性检验和方差检验。拟合优度为R2均在0.97以上,表征回归离差占总离差的百分比(数值越接近1说明线性关系越好),可知自变量和因变量之间有线性关系,模型具有良好的解释能力。取显著水平5%,F值远远大于F检验的临界值F(p,n-p-1)=0.0128,说明所有的回归模型从整体上成立。取显著水平为5%,T检验的临界值为T(n-p-1)=1.06,所有回归系数都在5%的水平下显著,认为变量显著性较好。回归方程方差分析的显著性检验值为p值均小于0.01,说明方程是高度显著的,表明自变量和因变量之间的线性关系能够成立。(2)共线性检验。通过方差膨胀因子(VIF值)诊断自变量间的多重共线性,自变量的VIF值都小于5,可以认为模型不存在多重共线性。(3)异方差检验。利用spearman等级相关检验法检验回归模型的异方差情况(检验结果大于0.05则不存在异方差),模型残差检验结果均大于0.05,不存在异方差现象。(4)自相关检验。利用D-W值检验模型的自相关性。线性模型的D-W值为1.8968,说明模型的相邻两点残差为正相关,但其数值非常接近2(DW=2,无自相关),可以认为模型中的残差近似不存在自相关性。(5)地区类别对建筑工程造价的影响。在回归模型中,地区类别的回归系数为-0.3077,说明地区类别与单位面积建筑工程造价成反比,符合实际情况。例如,第一类区(北京、天津、上海)的地区类别最小,单位建筑面积工程造价也最高。而且从标准化的回归系数来看,在14个影响因素中地区类别对单位建筑面积工程造价的影响最为显著。(6)模型的精度验证。随机抽取100个样本中的3个样本,将自变量代入模型中进行估算,将预测结果与实际造价相对比,验证模型的精度。结果表明,上述3个样本的预测造价与决算造价选自.代做预算网 www.yusuanw.com 偏差都在10%以下,精度符合我国可行性研究的规定,证明该预测模型精度可靠,能够满足投资决策阶段对建筑工程造价的预测。

4结语

当前建筑工程造价预测模型存在建模复杂、未考虑地区差异等问题,利用单位面积建筑工程造价对30个地区的居住建筑工程进行聚类分析,将30个地区划分为四类。将地区类别作为影响因素加入到线性回归模型,通过主成分回归分析得到居住建筑工程造价的预测模型。统计检验表明,该模型解决了传统线性模型存在的共线性问题,同时得到了地区类别对居住建筑工程造价的影响。

(栏目:工程造价知识/)

精选文章

代做工程预算
顶 ↑ 底 ↓

联系> 18611114677(同微信)拨打电话