基于统计分析的数据挖掘在工程造价管理中的应用

时间:2022-07-15 01:25:01

基于统计分析的数据挖掘在工程造价管理中的应用

摘 要: 工程造价管理部门需记录的工程造价数据越来越多,这就需要引入基于统计分析的数据挖掘。数据挖掘在工程造价管理中可实现建立数据库、数据净化处理、数据查询—共享、分析预警功能。在实际应用中,还可通过选择工程单方造价指标、造价核减率、竣工结算价、工程结构形式等因素等进行数据筛选。其具有数据库越来越安全、数据分析越来越准确的趋势。

关键词: 数据挖掘;工程造价管理;数据库;分析预警

0 前言

随着我国市场经济深入发展,传统的工程造价管理模式已不适应形势发展的需要,主要表现为:一是随着工程造价管理范围的不断拓展,造价管理部门需记录的工程造价数据越来越多,以纸质载体为主的信息获取、加工、处理方式已不能满足需求;二是工程项目建设周期长、多次计价、计价主体多的特点,使得造价管理工作分散,造价数据的完整性和及时性需进一步提高;三是国有资金投资项目概算超估算、预算超概算、决算超预算的“三超”现象仍屡见不鲜等。如何能动态、准确、高效的记录并处理工程造价数据,就逐渐成为必须解决的新问题。如何利用这些海量的信息资源为造价管理提供科学的决策,更好地为工程造价行业服务,已越来越为人们关注。在这个背景下,工程造价管理数据挖掘应运而生。

1 数据挖掘的应用步骤和技术方法

数据挖掘,是指从数据库中抽取提取隐含的、事先未知的、具有潜在有用信息和知识的非平凡过程。数据挖掘的基本步骤包括:数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估、知识表示。[1]数据挖掘的方法大体分为统计型和人工智能型。统计分析的理论基础主要是统计学和概率论原理,是一种较为精确的数据挖掘技术。具有容易理解,对结果描述精确等优点。[2]

2 基于统计分析的数据挖掘在工程造价管理中的理论应用分析

针对工程造价信息数据的特性,在传统的基于数据库、知识库和模型库的决策支持系统基础上,采用数据仓库、联机分析、数据挖掘等有关理论与技术,构建出工程造价管理系统模型,全面引入智能计算机技术,为工程造价信息的综合管理、智能分析和实时决策支持提供可行的方案。数据挖掘的两个基本目标是描述和预测:描述关注的是找出现有数据背后隐藏的规律或模式;预测则涉及到使用数据集中的一些变量用来预测其他我们所关心变量的为止或未来的值。[3]

数据挖掘在工程造价管理中的应用分析如下:

1)建立数据库功能。系统按照具体工作职责及办事流程,进一步细化造价管理工作,形成发承包计价手册、招标控制价备查、施工合同备案、安全文明措施费测定及竣工结算备案等业务工作全部通过系统办理、互相关联的管理模式。通过这样一个系统平台,将各种关系数据库、文本文件等数据集成到数据仓库中的各个主题中去。[4]比如在发承包计价手册中分类详细记录某企业概况、工程造价表、造价师、造价员、违规违纪记录以及变更记录,其中工程造价表关联安全文明措施费测定及竣工结算备案等业务。

2)数据净化处理功能。存在不完整的、不一致的数据是大型的数据库的共同特点。不完整数据的出现可能有很多原因。比如数据录入时主观判断错误,认为不重要就没有输入。或者因为设备故障,记录的历史或修改的数据被忽略。因此有必要从数据库中把错误的、异常的、无效的数据剔除掉,数据净化功能可以避免小概率失误事件在取样时影响样本代表性。[5]如在办理发承包计价手册过程中,输入已办理过的营业执照号或者遗漏输入企业重要信息,系统会自动发出提示。

3)数据查询—共享功能。系统实时记录发承包工程各阶段的造价数据并通过网络平台向社会公示,提供包括在泰施工合同备案、现场安全文明施工措施费测定、竣工结算情况以及违纪记录等动态信息的查询。这个部分主要是将系统查询、分析、挖掘出来的结果以可理解的、直观的、有效的形式展示出来。

4)分析预警功能。分析预警功能首先在于对人的预警,主要体现在严格按规定和细则标准办事上。在工程造价管理系统中,每个流程的环环相扣,只有上一步审核通过了,才能进入下一个流程,每一步都同步显示在查询系统中。在细化工作内容的同时,做到公开透明高效办公,实事求是诚信服务。

其次在于价格预警,主要体现在三个方面。1)通过在招标控制价备案时由咨询单位填写材料暂估价信息,再经过对数据进行挖掘、统计、分析,最终确定材料价格走向趋势;2)经测算的单方造价指标为工程测算描绘出一个总体的造价趋势;3)通过数据挖掘直观清晰的显示出国有投资工程造价增减情况。

3 基于统计分析的数据挖掘在工程造价管理中的实例应用分析

在工程造价管理系统中,可通过选择工程单方造价指标、造价核减率、竣工结算价、工程结构形式、招标方式、竣工结算审核单位、竣工结算日期等因素等进行数据筛选,通过后台数据库统计分析后选出符合目标值的数据类型。

比如,选取出2010年1—7月某市市区竣工结算审定价超过100万元的工程计32项。其中,6层以下砖混住宅楼7项,6层以下框架住宅楼6项,18层框剪住宅楼2项,框架综合楼5项,框架厂房3项,内装饰工程5项,外装饰工程2项,普通沥青路2项。

经测算,6层以下砖混住宅楼平均单方造价为801.65元/平方米,6层以下框架住宅楼平均单方造价为941.39元/平方米,18层框剪住宅楼平均单方造价为1080.37元/平方米,框架综合楼平均单方造价为1326.36元/平方米,框架厂房平均单方造价为852.70元/平方米,内装平均单方造价为24.58元/平方米,外装平均单方造价为824.94元/平方米,普通沥青路平均单方造价为354.55元/平方米。

某市市区2010年1—7月竣工工程单方造价指标如上所示的典型工程造价指标信息,是某市定期的,具有代表性、以审定的工程结算为主的住宅(含经济适用房或廉租房)、公共建筑、市政道路等工程造价实例信息,它为社会和造价管理机构提供可参考的、较详细的实际工程造价经济指标和消耗量指标信息。

总的来说,通过数据分析处理,可以简单快捷的从繁重冗杂的工程造价数据中找出共性或者异性的数据。有效加强了工程造价的全过程动态管理,强化了工程造价的约束机制,为维护有关各方的经济利益,规范价格行为,促进微观效益和宏观效益的统一提供了广阔的平台。

4 数据挖掘在工程造价管理中的发展趋势

4.1 数据库越来越安全

随着工程造价数据库不断扩大,数据挖掘的个人隐私与信息安全问题越来越受到关注。在未来可以通过对数据字段、数据库文件存储加密,以及在文件传递与网络通信时进行加密处理等方法,也有研究指出基于同态加密技术的算法既可以实现与原始挖掘同样准确度的效果,并实现隐私保护的目的。[6]

4.2 数据分析越来越准确

因取样时可能存在数据编码冲突、数据模式冲突等[7]原因,据统计,当前的挖掘方法准确度一般难以超过85%。[8]基于统计分析的数据挖掘并不具有人工智能分析的特性,例如目前系统无法分析合同价与竣工结算备案价相差甚远的原因,如果仅通过简单选择价格范围来选择数据进行挖掘分析,就会出现较大误差。所以进一步细化数据库的分类管理是更好开发数据挖掘功能的前提。

参考文献:

[1](加)韩家炜、(加)坎伯,数据挖掘:概念和技术[M].北京:机械工业出版社,范明等译,2001:10—11.

[2]黄解军、潘和平、万幼川,数据挖掘技术的应用研究[J].计算机工程与应用,2003(2):4—47.

[3]曹卫东、房芗浓,数据挖掘在智能交通系统中的应用分析[J].计算机工程,2005(7):92.

[4]张通学,面向领域的数据挖掘平台相关技术研究及实现[D].大连:大连交通大学,2007:20—22.

[5]胡文瑜、孙志挥、吴英杰,数据挖掘取样方法研究[J].计算机研究与发展,2011(01):46—49.

[6]钱萍、吴蒙,同态加密隐私保护数据挖掘方法综述计算机应用研究[J].2011(05):1615—1617.

[7]徐雪琪,基于统计视角的数据挖掘研究[D].浙江:浙江工商大学,2007:88—91.

[8]王永恒,海量短语信息挖掘技术的研究与实现[D].长沙:国防科学技术大学,2006:7—8.

作者简介:

王若冰(1986—),江苏靖江人,本科,助工,泰州市工程造价管理处。

上一篇:现代信息技术在石油钻井中的应用 下一篇:空中鸟瞰“中土”乐园:新西兰VIP私人飞机观光