浅议数据挖掘技术在计算机审计中的应用

时间:2022-09-16 01:11:49

浅议数据挖掘技术在计算机审计中的应用

摘要:在信息化大环境下,随着金审工程的推动,数据挖掘技术在审计领域的应用越来越广泛。它能辅助审计人员从审计数据中发现隐藏的、有用的知识信息,形成明确有效的审计思路,得出正确的审计结论。该文简要介绍了数据挖掘技术,讨论了数据挖掘技术在计算机审计中的应用,并给出了数据挖掘技术在计算机审计中的具体应用步骤。

关键词:审计;数据挖掘;计算机审计;技术;应用

中图分类号:F239 文献标识码:A 文章编号:1009-3044(2013)15-3445-02

随着网络的发展,我国的审计事业步入了计算机审计时代,这样以来大大提高了审计工作的效率。在实际审计过程中,审计人员还要改变自身的审计分析思路,要打破传统的审计模式,能够运用系统论的思维,以全局的观点、联系的观点,把握事物的总体和各部分之间的联系,从而发现其中的规律。可以借助于一种数据分析工具——数据挖掘技术,它能够帮助审计人员从海量数据当中,发现数据背后潜在的联系和规律。

1 数据挖掘的定义和常用技术

数据挖掘(DM),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中的、人们事先不知道的、但又是潜在的、有用的信息和知识的一种过程。

通过数据挖掘,不但可以来完善、丰富数据库,也为用户决策提供数据支持。常用的技术有以下几种:

1.1关联分析

关联分析的目的是为了找出数据库中隐含的关联规则。

1.2分类

分类对数据概念的描述建立模型,再用这个模型来进行分类,生成一系列的分类规则,用于对其他的数据进行分类,从而更好地理解数据库中的内容。

1.3预测

预测就是找出历史数据之间的变化规律,建立相应的模型,可以获得当前数据的未来变化趋势,所具有的属性值的范围、种类和特征等。常用的方法是回归分析法。

1.4聚类分析

聚类是一个将数据集划分为若干组或类的过程,类似于人们常说的“物以类聚”。

1.5偏差检测

数据库中的数据之间存在着很多异常的情况,称为偏差。这些偏差包括很多潜在且有用的知识,如分类中的反常实例、模式的特例等。

1.6时序模式分析

通过时间序列搜索出重复发生概率比较高的模式。

在实际审计过程中,选择合适的挖掘技术能给审计工作带来很大的帮助,而且不同的挖掘技术应用的对象也不同。

2 数据挖掘的应用价值

从审计角度来看,数据挖掘就是根据事先明确的审计目标,对被审计单位的大量业务数据进行分析,揭示其中潜在的逻辑关系和规律,并进而形成明确且有效的审计思路的过程。

数据挖掘技术在审计中的应用价值,主要体现在可以依据其发现的知识来构建审计分析模型,将其运用到实际的审计业务中,可以大大提高审计工作的效率。比如,通过对银行信用卡恶意透支的历史数据进行数据挖掘,可以发现“信用卡恶意透支与信用卡客户的收入状况、平均消费额、职业、年龄等客户属性之间的联系”这类知识,以此为基础构建出相应的审计分析模型并运用到被审计银行的当前信用卡业务数据中,审计人员就可以快速确定审计重点。

3 数据挖掘技术在计算机审计中的应用操作步骤

一般来说,数据挖掘技术在计算机审计中的操作步骤主要有以下几步:

3.1审计业务问题的定义

指的是要明确审计时需要发现什么信息、解决什么问题。这个定义驱动了整个数据挖掘的过程,是整个挖掘过程的基础,也是检验最后结果的依据。

3.2数据准备

这个环节包括数据采集、数据清理和数据预处理三项内容。

数据采集要尽可能地采集所有与需要解决的审计业务问题密切相关的数据。

数据清理将采集到的数据经过数据清理形成审计中间表,这些审计中间表就成为数据挖掘模型的实例数据集。

数据预处理工作首先进行数据集成,整合来自不同数据源中的数据,然后从集成的数据库中选择性地提取用与挖掘的数据,最后再对选择的数据进行投影、归一化变换等处理,方便进行下一步的数据挖掘。

3.3建立模型,挖掘数据

设计人员(包括经验丰富的审计人员)对预处理好的数据进行分析,选用合适的数据挖掘技术和方法,生成适合挖掘的数据模型。模型建立的好坏关系到数据挖掘结果的正确与否,可以说是整个挖掘过程的核心。模型不是一成不变的,需要经过反复的修改调整,最后才能成为适合当前的审计任务要求的挖掘模型。

利用建立好的模型,进行数据挖掘,输入相关审计数据,会得到具体的结果,或者数据间的规律。审计业务人员要根据这些结果,对模型以及模型的输入参数值进行多次的修正和完善,以利于得出正确的挖掘结果。

3.4分析评价结果

将挖掘模型最后得到的正确的结果,提供给审计人员。审计人员根据审计任务要求和被审计对象的特征来分析得到到的挖掘结果,得到明确有效的审计思路,从而得出正确的审计结论。有些结果可能会为发现审计问题提供线索,审计人员可以根据这些线索进一步地追查相关的资料,发现问题所在。

以上几个步骤在实际的审计过程中,往往不是一次完成,中间的某些步骤可能需要反复进行,这要根据当前阶段和将要实施阶段的审计任务要求来定。

4 结论

虽然数据挖掘技术在计算机审计应用,还处于初级阶段,还需要进一步的研究,不断地探索和完善。但是我们也看到了它在计算机审计领域的优势。在教育、金融、企业、经济责任等各行业的审计工作中,面对庞大的、复杂的数据库,使用数据挖掘技术,可以让审计人员在审计过程中迅速把握总体,从海量数据中根据需要找出有用的知识信息以及数据间潜在的规律和联系,进一步提高审计工作的效率,并为领导的正确决策提供数据支持。

参考文献:

[1] 牛丽敏.Apriori算法分析与改进综述[J].桂林电子科技大学学报,2007,27(4): 25-29.

[2] 韩家炜.数据挖掘概念与技术[M].北京:机械工业出版社,2000.

[3] (美)Mehmed Kantardzic.数据挖掘-概念、模型、方法和算法[M].北京:清华大学出版社,2003.

[4] 胡俊俊,孙静.一种新型的计算机审计模型[J].计算机应用研究,2008.

[5] 曾德胜,彭灿明.基于数据挖掘的审计系统研究[J].长春工程学院学报:自然科学版,2011(1).

[6] 杨录强.基于数据挖掘的计算机审计方法研究文献述评[J].中外企业家,2012.

上一篇:基于项目驱动的《网页设计与制作》课程教学的... 下一篇:基于Perl的企业级代码编辑器的实现