关于异构数据库数据共享的分析

时间:2022-04-11 01:58:00

关于异构数据库数据共享的分析

[摘要] 本文提出用XML进行数据转换以实现异构数据库的数据共享,从而实现了信息的标准化,有效地解决了以往集成系统信息不能用一种标准化的形式显示这一问题。

[关键词] 异构; 共享; 数据转换

[中图分类号] TP392 [文献标识码] A [文章编号] 1673 - 0194(2013)04- 0081- 01

异构数据库系统由相关的多个不同数据库组成,可以实现数据的共享和透明的访问,每个数据库系统都是独立存在的,并且具有数据库管理系统。异构数据库的各个组成部分具有自身的自治性,在实现数据共享的同时,每个数据库系统仍保持自己的应用特性、完整性控制和安全性控制。异构数据库系统的目标在于实现不同数据库之间的合并和共享。

1 异构数据库系统

异构数据库系统的目标在于实现不同数据库之间的数据信息资源、硬件设备资源和人力资源的合并与共享。集成的关键技术是以每个局部数据库模式为基础,建立全局的数据模式或全局视图。

2 异构数据库数据共享

由于异构数据库之间存在各种语义和语法上的冲突,要实现异构数据库中数据严格的等价转换比较困难。异构数据的转换目标是能够将源数据库中全部有意义的信息都转换到目标数据库中,而且这种转换包含尽量少的冗余信息。目前主要有如下几种数据转换方式。

2.1 使用软件工具进行转换

使用数据库管理系统的数据导入工具,将各个异构数据中的数据以文件的形势导入集成的数据库表中。如Power Builder的数据管道Data Pipeline、SQL Server的DTS、Oracle的SQL* Loader等可以实现各种异构数据库系统和文本、电子表格等文件系统格式的数据的整合和集成。编写每个分系统的数据转换代码,以完成原始数据转换、错误数据清理、数据结构转换、冗余信息消除、数据存储和数据刷新功能。

数据转换工具的缺点是不具有独立性,必须先运行该数据库产品的前端应用程序才能使用相应的数据转换工具,转换步骤繁琐,人工干预过多。此类工具一般都是各数据库的专用工具,与自身数据库的结合非常紧密。如果集成后的数据库不是数据转换工具所对应的数据库,数据转换工具就不能使用,只能用于集成具有同种类型DBMS的异构数据库。

2.2 利用第三方数据库的转换

利用第三方数据库转换,在进行大型数据库转换时,具有数据量庞大的特点。如果缺少工具软件的支持,就必须借助其他较小的桌面数据库如Access、Excel等。在实现两个具体数据库之间的转换时,根据字段定义、表定义和关系定义,从原始数据库中读出数据通过中间数据库的转换在导入到目的数据库中。

这种利用中间数据库的转换办法具有所需转换模块少和扩展性强的优点,缺点是需要人工撰写很多SQL语句以实现转换,实现过程相对复杂,转换质量不高,而且转换过程较长。

2.3 设置传递变量的转换

使用数据库应用程序开发工具与数据库连接的功能,通过设置两个不同源数据库与目的数据库的传送变量,实现两个数据库的连接和异构数据库之间的直接转换。这种办法在现有的数据库系统下扩展相对容易,而且转换速度和质量相对较高,但缺点是通用性较差。

2.4 通过数据库组件的转换

利用数据库应用程序开发技术,在配置ODBC的基础上直接利用其自带的数据工具来完成数据转换。源数据库与目的数据库通过ODBC组件来存取数据,实现异构数据库之间的直接转换。通过组件存取数据的关键是信息的数据类型问题,如果源数据库与目的数据库对应的数据类型定义不相同,必须先进行数据类型的等价转化再进行数据转换,而完全的等价转换难度较大。

2.5 利用XML实现转换

XML具有平台性无关、可扩展性和互操作性,具有数据语义描述和传送能力,是理想的数据源交互媒介。XML的灵活性和可扩展性使其可以对不同应用甚至差异很大的应用间的数据进行描述,尤其是对于那些专用于记录数据的应用。另外,XML具有自我描述性的特性,使数据可以在不同的应用间进行交换和处理,而不必要求相应的应用程序是针对该数据定制的。

XML可实现基于Web浏览的多样式可视化显示,而中间转换处理程序则用来访问数据库管理系统中的数据和输出XML文档。为了在数据库和XML文档之间传递数据,必须在文档结构和数据库结构之间建立映射。中间转换处理程序功能实现的关键就是完成映射的建立。

基于XML的异构数据库集成的关键是建立数据公共映射模型以实现数据库模式和XML模式之间的映射关系,将关系模型映射到该公共数据模型,再将公共模型映射回关系模型。该模型必须满足条件:

(1) 模型应尽可能的简单,易于操纵,易于与数据库模型相互转换。

(2) 模型应具有良好的描述性,能够完整的描述数据模型,具有良好的可扩展性。

(3) 模型实现数据结构和数据操作的映射外,还具有数据库完整性约束,以避免参照完整性不足带来的插入和删除异常。

3 结 语

异构数据库所涉及的数据形式主要有结构化数据、半结构化数据和非结构化数据3种类型。结构化数据广泛存在于各种信息系统的数据库中,以关系数据库最为普遍。半结构化数据通常以Web页面为主要代表,非结构化数据如普通文件、电子邮件和各种文档等,XML可以有效地进行管理与处理这两种数据。利用XML实现数据转换以实现异构数据库的数据共享是一种比较理想的方案,该方案的关键是建立相应的映射模型。

上一篇:微电子技术与产业群研究 下一篇:提高蒲江县柑桔品质的技术措施