分布式数据库中数据复制及数据分片的应用

时间:2022-09-05 11:40:29

分布式数据库中数据复制及数据分片的应用

摘要:维持数据的一致性是在分布式数据库中进行数据复制及数据分片的重要前提条件。通过对MS SQL Server 2000中的数据复制构件、事务模型和基于XLM的中间件模型的分析探讨,对数据复制的概念、原则、方法进行了详细的论述,最后对基于XML 中间件的数据分片方法进行了分析。

关键词:分布式数据库;数据复制;数据分片

中图分类号:TP391文献标识码:A文章编号:1009-3044(2011)36-0000-0c

通常,分布式数据库系统需要维护数据库的多个副本,保持数据库多个副本间的数据一致性是分布式数据库系统维护的重点。数据复制能够将数据副本建立在不同的节点上,是重要的分布式数据库应用技术,能够避免因为某一个节点失效而导致分布式数据库崩溃的情况出现。在不同的数据副本上操作不同节点上的事务,进行单副本串行是保持数据库中不同数据副本间的一致性的重要方法。利用SQL Server 2000中的数据复制功能,可以把主要精力放在本地副本更新上,由分布式数据库系统完成其余副本的更新。

1 数据复制概述

数据复制能够将数据库中的数据备份到互联网、广域网或是局域网连接的服务器、站点的数据库当中,是强大的、重要的分布式数据库应用技术。数据复制能够保证各个副本之间数据的一致性,保持数据的同步。数据复制具有提高分布式数据库系统的性能,提高数据可用性,提高数据查询的速度等优点。通常,分布式数据库中,以数据更新传播的不同方式为依据,将数据复制分为异步复制和同步复制两大类。数据同步复制是事务执行的内容之一,其将每一个更新操作同时传送至其他副本的另外节点之上,并同时提交全部副本的更新。数据异步复制不同于数据同步复制,其将所有更新纳入到一个事务中,然后传送至副本的另外节点,使通信量降低,并且减少事务回滚而导致的代价。数据复制能够将已有中心数据库中的信息备份到各级拥有信息需求的不同数据库当中,也能够把各级分布数据库中的信息备份到中心数据库当中,从而有利于进行全局联机的决策支持分析与事务处理。

2 数据复制在SQL Server 2000中的应用

在维护同一个数据库多个副本间的一致性方面,SQL Server 2000提供了较为完备的复制功能。SQL Server 2000中数据复制的相关主体是者、分发者和订阅者。在SQL Server 2000中,用户能够利用数据库中已有的数据。用户处理数据时,即使断开了连接也能够进行数据副本处理。只要在重新连接后,用户将更改的内容传送至数据库当中就可以了。这样充分确保了各个分布数据间的独立性。SQL Server 2000中主要有事务复制、快照复制与合并复制三种类型的数据复制模式。首先,事务复制模式。在订阅服务器上进行数据初始快照运行,如果在服务器上进行数据更改,就使用事物日志对个别事务进行捕获,然后将个别事务传送至订阅服务器。其次,快照复制。直接分发数据位于某个时刻的状态,不对数据更新进行监视。把器中的数据复制到订阅服务器中进行数据复制。快照复制适合更新次数较少的大量数据的数据复制。最后,合并复制。在订阅服务器接收数据的过程中,不论订阅和服务器之间是否进行了有效的连接,数据更新都可以照常进行。在订阅服务器和服务器连接时,合并复制能够合并所有的更新。

这些复制类型都能够保证各个层次数据一致性的需求,为事务的ACDI属性提供了相应的功能。事务复制、快照复制与合并复制所具有的特点和功能都能够满足独立性与一致性的数据复制的要求。其中,事务数据复制是常用的便捷的数据复制方法。事务数据复制能够将数据库中的数据传送至其他的数据库,能够记录DELETE、UPDATE、INSERT等不同类型的数据操作。在维持数据复制的一致性方面,事务复制采用异步复制方式,将数据分发至订阅服务器,并进行增量修改。事务复制在SQL Server 2000中主要由三部分构成:日志读取、分发和快照。快照能够形成数据文件和描述文件,与新的订阅数据库保持同步。日志阅读器能够在分布数据库中插入事务日志中的事务。分发能够将复制事务从数据库中传送至订阅者。快照、日志读取和分发相互协调,保证各个副本的传输数据保持同步。

3 基于XLM的中间件模型及数据分片

3.1 基于XLM的中间件模型

基于XLM的中间件模型的主要功能模块包括:全局DOM树、中心处理模块、局部DOM树以及包装器。首先,全局DOM树。W3C组织推荐的DOM是一组用于合法HTML文档与XML文档的编程接口。全局DOM树允许脚本与程序进行动态访问、结构更新、文档内容更新和类型更新。其次,中心处理模块。中心处理模块是中间件模型的核心模块,它按照相关的数据分片策略,参照XML或DTD提供的路径模式信息,处理全局DOM树上的路径实例,在各个站点上分布每种模式的路径实例。第三,局部DOM树。在数据分片完成之后,在各个站点上利用DTD模式信息重新构建和全局DOM结构相同的局部DOM树。局部DOM树是全局DOM树的子集,如果把所有站点上的局部DOM树合并在一起,就能够得到全局DOM树。最后,包装器。通常,数据源均具有自己的包装器,在获得查询请求之后,就会从数据源中进行数据检索,找出所需的数据,并且将数据转化成XML形式。此外,数据源中的包装器能够进行数据源和DOM树之间的转换操作。从纵向来看,包装器、局部DOM树与其所对应的数据源共同形成了一个处理单元;从横向来看,包装器、局部DOM树、核心出来模块与全局DOM树共同组成了XML的中间件层。

3.2 数据分片

数据分片是分布式数据库的重要技术之一。传统的数据分片技术有Hybrid-Range分片策略、Range分片策略、Round-Robin分片策略。这些分配策略适用于有着固定模式的数据库,而不适用于无固定模式的、半结构化的XML文档。HRPS是一维分片方法,其划分的根据是关系中的某一个属性值,划分好的每个子空间内的数据元组数量相同,数据元组的值域互不相交。查询响应时间极小化是HRPS的重要目标,在查询数据时应当注意网络通信、磁盘I/O、CPU这些基本资源的占用。HRPS在XLM中间件基础上的扩展方法——EHRPS。EHRPS划分全局DOM树遵循以下原则:子空间包含路径实例数量大致相同的局部DOM树;子空间均只包含路径实例不重复的集合;根据DTD提供的路径模式信息,在不同站点上进行路径实例分配。由于中间件是统一的数据模型,在DOM树查询的相应时间当中会发生中间件系统资源消耗。DOM树的合并和XML文档生成DOM树的时间影响着DOM查询的响应时间。

4 结束语

综上所述,数据复制与数据分布在分布式数据库中有着广泛的应用。分布式数据库中,根据数据更新传播的方式将数据复制分为异步复制、同步复制两大类。在SQL Server 2000中的数据复制的主要有事务复制、快照复制与合并复制三种类型。事务型数据复制能够从一个数据库向其他的数据库分发数据,是一种较为理想的数据复制方法。在SQL Server 2000中事务复制主要由日志读取、分发和快照三个有机环节组成。全局DOM树、中心处理模块、局部DOM树和包装器是基于XLM的中间件模型的主要功能模块。Hybrid-Range分片策略等传统的数据分片技术适用于有着固定模式的数据库。EHRPS是HRPS基于XLM中间件的扩展方法,适用于无固定模式的、半结构化的XML文档,能够降低查询难度,提高查询的准确度。

参考文献:

[1] 朱丽丽.分布式数据库在高校的应用策略[J].科技信息(科学教研),2008(17).

[2] 涂承胜.基于VB的数据库的图像处理技术[J].计算机工程与设计,2003(6).

[3] 王祥武.数据复制技术比较[J].信息系统工程,2010(3).

[4] 勒敏,刘建辉.分布式数据库系统数据一致性维护方法[J].科技广场,2008(3).

[5] 张建飞.数据复制系统的研究[J].才智,2011(11).

[6] 刘荣.分布式数据库系统数据复制技术的研究[J].电脑知识与技术,2009(7).

[7] 徐丽萍,袁刚,卢炎生.DRMDP:一个基于动态优先级的反射式数据复制中间件[J].计算机工程与科学,2009(2).

[8] 陶钧,沙基昌,王晖.网络环境下给予编码机制的数据复制研究[J].计算机科学,2008(2).

上一篇:开心麻花:好东西需要时间的培养 下一篇:Linux下基于数据库支持虚拟用户FTP的实现