数据挖掘技术在电子政务中应用

时间:2022-09-22 04:12:51

数据挖掘技术在电子政务中应用

1 数据挖掘技术介绍

数据挖掘(DataMining),又称数据库中的知识发现,是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式,是数据库研究中的一个很有应用价值的新领域,融合了数据库人工智能、机器学习、统计学等多个领域的理论和技术。数据挖掘工具能够对将来的趋势和行为进行预测从而很好地支持人们的决策。

何谓数据仓库,数据仓库概念始于20世纪80年代中期,首次出现是在号称“数据仓库之父”WilliamH.Inmon的《建立数据仓库》一书中。随着人们对大型数据系统研究、管理、维护等方面的深刻认识和不断完善,在总结、丰富、集中多种企业信息的经验之后,为数据仓库给出了更为精确的定义,即“数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合”。数据仓库并没有严格的数学理论基础,也没有成熟的基本模式,且更偏向于工程,具有强烈的工程性。因此,在技术上人们习惯于从工作过程等方面来分析,并按其关键技术部分分为数据的抽取、存储与管理以及数据的表现等三个基本方面。数据仓库的特征主要有4个方面:数据仓库是面向主题的、所包含的数据是集成的、其数据是不可更新的及数据仓库是随时间变化的。

2 电子政务的含义

电子政务所谓电子政务,是政府机构应用现代信息和通信技术,将管理和服务通过网络技术进行集成,在Internet上实现政府组织结构和工作流程的优化重组,超越时间和空间及部门之间的分隔限制,向社会提供优质和全方位的、规范而透明的、符合国际水准的管理和服务。电子政务主要包括以下三个方面:①政府间的电子政务,如电子法规政策、公文、司法档案、财政管理等系统。②政府对企业的电子政务,包括电子采购与招标、电子税务、电子证照办理等系统。③政府对公民的电子政务,教育培训服务、就业服务、电子医疗服务。

早期的数据挖掘技术主要针对的是大型数据库,而电子政务中的数据挖掘技术则是基于网络,除了处理传统数据库中的数值型结构化数据外,处理更多的是文本、图形、图象、www信息资源等半结构、非结构数据。原因在于电子政务是随着社会经济飞速发展、人们对政府和职能部门高效运转的要求越来越高,政府重塑理论和新公共管理理论的发展而产生的。[1]电子政务自产生后就得到了快速发展并且迅速成为支持工业化大政府向新型管理体系转变的重要技术保证。电子政务的核心是实现行政和日常事务网上管理,建立政府、社会和公众之间的有机服务系统,将大量决策权下放给团体和个人。[2]经过多年的实践,我国电子政务建设和应用已初见成效。人口基础信息库、法人单位基础信息库、自然资源和空间地理基础数据库、宏观经济数据库的建立产生了海量的空间数据和非空间数据。这些数据中隐藏了丰富的知识和规则,但目前的许多系统只是实现数据的输入、查询、统计等功能,难以发现数据中存在的关联、关系和规则,无法从大量的数据中提取有用信息以预测发展趋势。将这些规则从海量的数据中提取出来,将有望为电子政务空间辅助决策系统建立提供支持。而这个信息提取过程应当以数据挖掘和知识发现为基础。

3 电子政务与数据挖掘的关系

简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识的过程,有时也被人们称为知识挖掘、知识提取、知识发现、数据、模式分析等。它是现代数据库技术发展与人工智能(及其学习、模式识别)技术相结合的产物。在数据挖掘领域,数据挖掘功能发现的模式类别主要有关联规则、分类、聚类、概念描述和偏差检测等。这些模式也是电子政务数据挖掘所需要的。数据挖掘的结果就主要体现在这些模式的发现上,这是一个极其复杂的过程。其中核心的问题就是用何种方法来有效地从已知数据中挖掘知识。在电子政务中数据挖掘的常用方法主要有决策树方法、统计的方法、归纳法、神经网络方法、遗传算法、粗糙集方法、人工智能、模糊集方法等。电子政务中的数据挖掘是指为政府各种业务活动、工作、决策寻找知识,一般电子政务中数据挖掘的过程应该包括数据准备、挖掘处理、知识表达与解释三个阶段。数据准备是为电子政务数据挖掘提供挖掘对象的阶段。主要是针对需求分析的结果做挖掘对象的准备工作,其主要内容有数据的预处理(如抽取、转化、净化、理解等)以及建立数据挖掘处理集等。通过数据准备提高数据挖掘质量,减少数据的杂乱性、冗余性和不完整性。挖掘操作是数据挖掘的核心,主要是通过算法引擎选择挖掘算法后,对数据准备阶段建立的数据挖掘处理集进行挖掘,从中发现感兴趣的知识。表达和解释阶段是对挖掘结果进行分析,提取出最有价值的信息,以图表形式或其他可视化手段展现给用户。

电子政务需要数据挖掘,当前政府机关的各种应用信息系统虽然已经基本上建立起来,但是各种信息系统在建立之前,缺乏数据信息和系统的统一标准接口的规划,同时由于采用不同的数据库即异构化,使得整个信息系统有如下缺陷:①数据格式多种多样,一致性较差,存在数据冗余;②数据来源多,数据存放分散,缺乏统一管理和联系;③数据量虽大,但对数据资源的开发利用不充分。作为政府职能部门,需要的不仅仅只是简单的数据信息的直观罗列,而是一种对工作具有积极指导、帮助意义的数据信息。这种数据信息的基本要求如下:①能够对复杂的动态社会环境做出及时响应,并要求在大量的数据中找出有价值的信息和情报作为决策时参考的依据;②在决策过程中,一旦需要,决策人员可以很快得到方方面面详尽的信息和情报支持,包括历史的、当前的、未来的各种信息和情报资源;③支持对不同地点的数据或信息进行调阅操作,包括内部、外部或远程的数据和信息;④支持对不同类型和格式的数据或信息进行操作,包括结构化、半结构化和非结构化的信息类型;⑤更多的政府主管领导和职能部门的辅助决策需要数据信息的支持;⑥要求信息资源能实现充分共享与快速交流。

4 数据挖掘技术在电子政务中应用前景展望

电子政务对数据挖掘技术的需求及应用由应用现状可知,如何利用新技术使已有的政务数据实现有效共享并及时转变为知识、财富,实现府民双方互动通信,已经成为电子政务建设中的一大技术因素。其中,数据挖掘技术可以对政府部门的数据进行开采和提炼,使其成为有用资料,为政府决策等发挥指导、预测作用。

下面将从五个方面详细阐述电子政务对数据挖掘技术的需求及应用:①降低成本、减少财政开支数据挖掘技术的应用可以打破各级政府之间文件传递的繁琐性,用最快捷的电子方式在政府上下级之间进行信息传递。不仅降低了政府办公用品及相关开销,而且无形中节约了大量的时间、减少了大量的额外开支,大大提高了工作效率。②提供形势分析与决策支持电子政务中的数据挖掘技术,可以对政务系统中的海量数据进行开采、挖掘和分析,从中识别、抽取隐含信息,并利用这些信息为政府部门重大决策、法规的制定提供依据。③提供实时、有效的信息。政府部门若要充分发挥其职能作用,就必须进行及时、有效的监控和管理。数据挖掘技术可以帮助增强公众与政府间沟通、通讯的时效性,保证双方都可以及时、准确地掌握到有效信息,建立起一个可以有效收集、监理、分析所获数据的系统。④提供功能强大的搜索引擎。数据挖掘技术是目前网络信息检索发展的一个关键。如通过对网页内容的挖掘,可以实现对网页的聚类、分类,实现网络信息的分类浏览与检索;同时,通过对用户所使用的提问式历史记录的分析,可以有效进行提问扩展,提高检索效果;另外,运用数据挖掘技术还可以改进关键词加权算法、提高网络信息的标引准确度,从而改善检索效果,大大提高电子政务处理的效果和效率。⑤政务创新能力的体现创新是政府职能向知识型政府转变的基本要求,它不仅仅局限于行政方面和政务处理流程的层面之上,而需包括政府制定发展战略和创新公共政策。电子政务中的数据挖掘技术增强了政府应对突发事件的快速响应能力,提高了政府工作的创新能力和人员素质。

合理评价挖掘的知识、确定其可信度及在应用中的权重,并对知识进行有效的管理,是知识应用中的重要问题,也是数据挖掘与知识发现走向现实应用的关键之一。这些问题应该给以足够的重视,以保证提供知识的合理性、科学性、准确性和可靠性。除了以上几点之外,数据挖掘多平台支持、与其他系统的集成也是要考虑的重要问题。数据挖掘在电子政务中的应用通过数据挖掘实现知识获取,可以逐步建立起智能的辅助决策系统,为电子政务中的决策服务。具体体现在:

4.1 数据挖掘可以实现电子政务中典型空间信息的自动提取。例如利用这一点可以实现工程的建筑选址。对几个待选地点的遥感图像进行典型信息自动提取,分析各个地点的地形地貌等特点,找出最合适的建筑地点。也可以从TM图像中提取水体、居民地以及植被等信息,在此基础上进行城市规划,或者为旅游业发展服务。还可以对数字城市中的各种资源分布进行状态分析,为城市各种资源在空间上的优化配置、在时间上的合理利用,宏观、全局地制定城市规划和发展战略,减少资源浪费,为实现可持续发展提供科学决策的依据。

4.2 数据挖掘可以提高政府对各种突发事件的快速响应能力。利用数据挖掘工具,对历史记载下来的突发事件进行挖掘,从中提取、总结、升华相关经验教训,得到今后应对突发事件的各种知识,制定出有效高效的措施,提高政府的快速响应能力。例如在面向洪水管理的电子政务系统中会商决策的子系统中,可以加入数据挖掘模块,根据挖掘的知识做出防洪调度方案或者应急处理方案,确保防洪工程安全、充分发挥防洪工程效益、尽量减少洪灾损失。

4.3 数据挖掘可以帮助解决政府的许多日常工作。通过数据挖掘可以对宏观政策、法规的研究制订以及日常招聘招标等工作快速反应,更好的为民众、为社会服务。例如在公务员招聘中,可以根据用人单位的需求确定挖掘目标,进行数据挖掘,自动挑选出最符合要求的报名者以供选择。

4.4 数据挖掘可以促进政府电子贸易的发展。运用网络数据挖掘技术自动发现系统的访问模式和用户的行为模式,从而进行预测分析。例如,可以通过评价用户对某一信息资源浏览所花费的时间可以推断出用户对何种资源感兴趣;应用聚类分析来识别用户的访问动机和访问趋势。

4.5 数据挖掘可以优化政府网站设计。通过对网站内容的挖掘,可以有效组织网站信息,把握用户兴趣,吸引更多的用户。

4.6 数据挖掘是电子政务辅助决策系统的重要技术手段。例如在辅助决策系统中通过对各种经济资源的挖掘确定未来经济的走势,从而制定出相应的经济策略。

综上所述,数据挖掘是电子政务一项重要的应用技术和支持技术,可以为各级政府的决策提供科学的依据,提高各项政策制订的科学性和合理性。随着分析决策难度的增强,人们对决策分析工作的智能化、自动化要求越来越高,数据挖掘将成为实现政府决策支持的核心技术,以数据挖掘为依托的政府决策支持系统将发挥重要作用。今后应面向电子政务的研究,重点研究实用的数据挖掘算法,开发业务型数据挖掘平台和工具,实现其与电子政务系统的集成,促进电子政务向智能化分析的发展。提升公务员队伍素质,全面提高行政效能,增强政府执行力和公信力。政府部门是一个国家最重要的信息机构。在工作过程中,政府部门建立了庞大的信息收集系统并积累了大量政务数据,这些政务数据的开发利用对于政府科学决策非常重要。同时,政府数据资源的开发利用也有助于打破各级政府部门对信息的垄断和封闭,推动政务公开的实施,使政务数据资源发挥巨大的社会效益和经济效益。

参考文献

[1] 马晶鑫.浅述数据挖掘在电子政务中的应用[J].当代经理人CONTEMPORARYMANAGER,2006.5

[2] 孙正兴,戚鲁.电子政务原理与技术[M].北京:人民邮电出版社.2003.4

[3] 苏新宁,吴鹏,朱晓峰等.电子政务技术[M].北京:国防工业出版社.2003.1

[4] 金江军,潘懋.电子政务数据资源的开发利用[J].地理与地理信息科学,2003.19(6):42-46

[5] 裴韬,周成虎,骆剑承等.空间数据知识发现研究进展述评[J].中国图象图形学报,2001,6A(9):854-860

[6] 陈侃.基于数据仓库技术的电子政务资源库[J].计算机工程,2004.30(5):81-83,89

[7] 飞.基于数据仓库、数据挖掘技术的电子政务建设[J].现代电子技术,2004

收稿日期:2007-12-20

上一篇:斡旋受贿客观要件探析 下一篇:“混合式学习”应用的分析与建议