基于XBRL技术的财务信息挖掘系统构建探讨

时间:2022-10-12 11:09:35

基于XBRL技术的财务信息挖掘系统构建探讨

【摘 要】 XML技术的出现,为在数据组织中更好的体现数据本身的含义提供了很好的途径。XBRL作为XML语言在网络财务报告中的应用,为在大量的财务信息中进行数据挖掘、发现知识提供了途径。本文对XBRL的技术框架及特点、数据挖掘技术及其在财务系统中应用进行了探讨,并给出了基于XBRL的财务信息数据挖掘模型。

【关键词】 XBRL; 数据挖掘; 财务数据; 构建

XBRL通常被译为可扩展的商业报告语言(extensible business reporting language),是一个开放式的不局限于特定操作平台的国际标准,通过它可以实现财务和商业报告数据及时、准确、高效和经济的存储、处理和交流。XBRL是在XML(可扩展的标记语言)的基础上发展起来的,是目前应用于非结构化信息处理尤其是财务报表信息处理的最新技术。它通过对财务数据进行特定的标签识别和分类,促进统一信息的财务数据在不同的计算机平台和财务信息使用者之间共享,极大地促进了财务信息数据挖掘的进行,满足了决策者对有用信息和知识的要求。

一、XBRL技术框架及特点

(一)XBRL技术框架

XBRL运用XML数据标记描述财务信息,主要由XBRL规范、XBRL分类标准、XBRL实例文档和样式表组成。XBRL规范,或称规格书、说明,是XBRL的核心和基础,它规定了XBRL的理念和原则,主要用于定义XBRL的各种专用术语,规范XBRL的文件格式,说明怎样建立XBRL;XBRL分类标准是XBRL为企业报告中的每个项目建立不同的标签,分类标准定义了各项目的属性及其之间的关系等,相当于一个行业商业信息交换的“词典”。分类标准是在技术规范的基础上,结合各个国家、行业、企业的实际情况制定的;XBRL实例文档是一个企业财务报告的实例文件,主要包含财务报告中的标签和数据。XBRL根据财务报告中标签与会计业务数据的对应,利用应用程序自动从会计业务数据库中提取数据,生成实例文档;样式表用于定义财务报告时的显示项目和格式。整个技术框架采用自下而上的层次结构(如图1所示)。

(二)XBRL特点和技术优势

作为一种以XML为基础发展起来的标记语言,XBRL继承了XML所拥有的所有语言优势,其特点和技术优势如下:

(1)无许可证限制,XBRL具有良好属性的开放式技术构架,它使任何财务信息供应链上的人都能免费、自由地在不同的软件平台上准备、获得、交换并分析财务信息。

(2)跨平台使用。由于XML文件可以跨平台使用,XBRL就具有了跨平台的优势。在不同的操作系统下,如Windows、Unix和Linux等,XBRL文件无需修改就可以直接使用。在不同的应用软件中,即使所用的数据库不同,只要转换成XBRL格式,也可以实现数据的交换。因而,通过XBRL 信息可以在不同的操作系统、数据库和应用软件之间进行传输和交换,XBRL是一种互联网上企业报告的通用语言。

(3)多种格式的输出。对同一份XBRL实例文档,采用不同的样式表,可以生成多种企业报告,所有报告的编制一次性完成,不仅降低了输入错误的风险,保证了数据的一致性,而且减少了重复输入,提高了报告的编制效率。对同一份企业报告,XBRL也可以按多种格式输出,如在浏览器上显示、转换成不同的数据格式进行传输,或打印成纸质财务报告等。

(4)搜索快速、准确。采用XBRL的方式,统一了网上的数据定义和格式,无需以人工方式找出网上的数据资料后逐一进行比较,所以XBRL在数据处理方面的效率要远远高于网络上常用的PDF、WORD、HTML格式文件,有利于网上搜寻引擎的自动搜寻和过滤工作,达到快速、准确。

二、数据挖掘技术及其在财务信息系统中的应用分析

(一)数据挖掘

随着数据库技术的广泛使用,以及计算技术和计算机性能与网络的迅速发展,人们面临着一个困难的问题,即如何从海量的数据中提取出有价值的信息。查询功能远不能满足人们的需要,数据挖掘应运而生。数据挖掘(Data Mining,DM)是从大量的、不完全的、有噪声的、模糊的和随机的数据集中识别有效的、新颖的和潜在有用的,以及最终可理解的模式的过程。

在当今瞬息万变的商业环境中,竞争的主要方式是信息的竞争,传统的事后分析型的数据分析方法被事前探索型的数据挖掘所取代。而与此同时,信息提供者之间也存在着激烈的竞争,如财务信息与非财务信息之间的竞争。XBRL技术的应用不但为财务信息提供者增加了竞争的筹码,也直接推动了财务数据挖掘的展开。

(二)财务信息系统中应用的数据挖掘策略

数据挖掘策略概括了一种解决问题的方法,即选择什么方式解决特定的问题。数据挖掘策略可以广义地分为有指导学习和无指导聚类。有指导学习是指利用已知的模型和属性来帮助我们进一步区分结构相似的对象。与有指导学习不同,无指导没有预先已知的模型和属性,所有变量均为自变量。在财务信息系统中主要应用以下几种数据挖掘策略:(1)分类,分类是用一个函数把各个数据项映射到某个预定义的类,或者说是发掘出关于该类数据的描述或者模型,重点在于建立模型,将新的实例指派给一组定义明确的类中的一个。例如:确定一项长期投资是否具有高风险;将进行赊销的客户归类为具有良好的或者不良的信用风险的客户群等。(2)估计,与分类模型类似,估计模型的目的在于确定一个未知属性的值。然而,不同于分类属性的是,对一个估计问题,其输出属性(一个或多个)是数值的而不是分类的。例如:估计一项投资的风险程度;估计当前应收账款中的坏账比例;估计筹资规模(数量)等。(3)预测,预测模型的目的在于确定未来的输出结果而不是当前的行为。通过建立表示数据中固有模式和趋势的模型,这样该模型可以用来对未来事件的结果进行预测,在财务系统中,常有的一些预测例子有:预测一项投资的未来收益;预测产品销售的价格趋势等。(4)无指导聚类,对于无指导聚类,没有因变量指导学习的过程。相反,学习规程通过使用聚类度量将实例分为两个或更多个类,来建立知识结构。无指导聚类策略的主要目标在于发现数据中的概念结构,是一种对具有共同趋势和模式的数据元组进行分组的方法。聚类经常用于搜索并且识别一个有限的种类集合或簇集合,从而描述数据。例如对客户群体分类,将目标消费群体化分为三个类:高收入、中等收入、低收入,针对不同类的客户采取不同的营销策略等。

到目前为止,大多数数据挖掘是借用人工智能的各种方法来挖掘数据中存在的知识。但是正如人工智能本身的发展现状一样,数据挖掘还不能很好的理解数据中存在的知识。XML技术的出现,不仅为互联网上的电子数据交换提供了一个标准,而且XML技术从数据的角度提供了一个更好的表示数据内容以及数据所代表意义的手段。XBRL作为XML在网络财务报告语言上的应用,则为我们理解大量的财务数据,为企业战略的建立提供有效的支持。

三、基于XBRL技术的财务信息挖掘系统架构模型

传统财务数据挖掘的一般过程主要包括财务数据源、财务数据的集成和变换、财务数据仓库、财务数据挖掘以及知识表达等几个阶段。首先将各种形式的财务数据经过集成和变换,去除冗余,转换成符合一定格式的数据,并装入财务数据仓库,而财务数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的财务数据集合,用于支持管理决策。财务数据挖掘是整个过程的核心部分,其目的是从大量的财务数据中挖掘出潜在的、有用的知识或模式。传统财务数据挖掘过程需要数据仓库的支持,而财务数据仓库的建立需要专业的技术手段,对大多数企业来讲,实现的难度很大,往往达不到预期的效果。

笔者设计的基于XBRL的财务数据挖掘过程,主要通过一个数据变换模块将各种格式的数据转换为符合XBRL规范的数据,解决了重要而繁杂的技术难题,财务数据挖掘是从具有统一XBRL描述形式的数据中挖掘出潜在的有用的知识或模式。

基于XBRL的财务数据挖掘模型如图2所示,主要包括财务数据获取模块、XBRL模式变换、财务数据挖掘以及基于XBRL的知识表达与理解四个部分。各部分之间的信息流动和数据交换都是基于XBRL进行的。

(一)财务数据获取模块

数据获取模块的主要功能是获取财务数据源,财务数据的来源可以有多种,可以是企业内部财务系统、本地外部财务系统、远程外部财务系统以及企业已经建立的诸如ERP、SCM、CRM、OA等系统和一些相关系统,这些系统数据格式千差万别,需要按照XBRL的语法格式和语义规则进行提取、转换,统一转换为XBRL模式数据。

(二)XBRL模式变换

基于XBRL的财务数据挖掘,其数据源必须是符合XBRL规范的财务数据,因此在进行财务数据挖掘之前,所有财务数据以及其他源数据都要经过处理,转换成符合XBRL规范的格式。这一过程需要通过XBRL模式变换来实现。根据数据的组织形式,XBRL模式变换模块的主要功能分为两个部分:一是对XBRL描述的财务数据源进行规范性检测;二是对非XBRL描述的财务数据进行XBRL封装。

(三)财务数据挖掘

利用多维分析工具、多维报表工具以及数据挖掘工具对数据进行综合数据查询、分析统计和生成统计图表等,通过采用分类、聚类分析、统计方法、关联规则、决策树方法、神经网络等数据挖掘方法,从大量的具有统一XBRL格式的财务数据中挖掘出潜在的、有用的知识或模式。

(四)基于XBRL的知识表达模块

知识表达模块的主要功能是对在数据挖掘模块中发现的知识进行可视化的表示,以便于非专业管理人员理解。财务数据挖掘的根本目的是从财务数据中发现有用的知识或模式,在知识的表示形式上,目前较好的且应用较多的有专家系统知识规则、决策树规则和在数据挖掘中的关联规则以及分类规则等。财务数据挖掘结果不仅要有利于人的理解,而且更主要的是要有利于计算机的理解,因此在数据挖掘完成之后,要将所得到的知识,形成符合XBRL规范的知识库。

四、结束语

XBRL在未来发展前景良好,所有企业都会向这一方向发展,所以面向XBRL数据挖掘也会得到长远发展。本文从XBRL的技术框架及特点、数据挖掘技术及其在财务系统中应用分析出发,结合传统财务数据挖掘的一般过程和XBRL技术,设计出一种基于XBRL技术的财务数据挖掘系统模型,为进一步深入研究财务数据挖掘提供了一种较好的方法。

【参考文献】

[1] 刘国英.基于XBRL的财务数据挖掘系统分析与设计[J].中国管理信息化,2008(18):12-15.

[2] 刘静.浅谈XBRL与财务信息数据挖掘[J].湖南财经高等专科学校学报,2004,20(6):53-55.

[3] XBRL Progress ReportApril 2003,www.省略/

whatisxbrl/index.asp.

[4] 倪海风.可扩展商业报告语言(XBRL)[J].佳木斯大学学报(自然科学版),2003(4):41-45.

上一篇:社会责任对财务会计基本理论的影响 下一篇:中外内部控制与风险管理理论与实务比较