重复数据删除的四个误区

时间:2022-10-11 10:12:41

重复数据删除的四个误区

数据压缩也好,重复数据删除也罢,只要是能更有效地消除冗余数据,对于追求低成本、高效率的存储用户来说都具有现实意义。虽然重复数据删除谈了两三年,但是许多人对这项技术仍一知半解,在应用中存在诸多误区。

误区一:重复数据删除是一个独立的产品

重复数据删除的好处很多,比如可以有效减少存储介质数量,减少数据传输所需的带宽,提升备份和恢复性能等。但是重复数据删除并不是万能的,不能解决数据备份面临的所有问题。美国飞康软件公司在美国进行的一项用户调查显示,46%的用户认为重复数据删除是一项功能。美国飞康软件公司全球行销副总裁江志祥表示:“重复数据删除并不是一个独立的产品,而是存储产品的一项功能,未来还有可能成为一项标配的功能。目前,80%的虚拟磁带库都已经具有了重复数据删除功能。”

目前,重复数据删除技术主要应用于虚拟磁带库。虚拟磁带库是一种新型的备份产品,但是仍然无法突破传统备份的限制,对RTO和RPO指标的改变作用不大。

误区二:重复数据删除比越高越好

许多用户在选购具有重复数据删除功能的备份系统时,将重复数据删除比作为一个主要的衡量指标,而且想当然地认为,重复数据删除比越高越好。然而,事实并非如此。重复数据删除比与许多因素有关,比如文件的类型(视频文件或加密数据的重复删除比就很低)、备份方式(全备份还是增量备份)等。江志祥指出:“其实,各厂商的重复数据删除产品的重复数据删除比相差不大,一般情况下都可以达到5∶1~10∶1,基本能满足用户的需求。用户在选购数据备份产品时,应该注意产品的可用性和可扩展性,而不要把目光仅仅盯在重复数据删除比这一个指标上。”

误区三:在线处理方式比后处理方式更好

重复数据删除通常有两种技术架构,即在线处理和后处理。所谓在线处理,就是在备份数据的同时进行重复数据删除。这种方式的好处是可以大量减少备份介质的数量,不足之处是有可能影响备份的性能。后处理方式是在备份进程结束后再进行重复数据删除。这种方式的好处是对备份性能影响较小,但减少备份介质数量的效果不太明显。从技术角度看,两种方式各有所长,并无优劣之分。江志祥表示:“用户更应该关注的是备份和恢复的性能、可用性以及备份设备上数据的安全,而不是纠缠于在线处理和后处理孰优孰劣。将高可用性集群技术引入到重复数据删除应用中,是未来的发展方向。”

误区四:重复数据删除软件一定要与硬件进行捆绑

一些专业的磁盘备份厂商,如Data Domain、昆腾、SEPATON等推出的具有重复数据删除功能的虚拟磁带库都是软硬件一体化的解决方案。但是,也有一软件厂商只是推出了重复数据删除软件,用户可视需要搭配第三方的存储硬件使用。软硬件一体化的重复数据删除系统在性能、可管理性、可用性等方面的表现会更优异吗?江志祥认为,重复数据删除软件是开放性的,与硬件平台无关。有些人认为软硬件一体化解决方案的性能更好,完全是受传统思维定式的影响。硬件平台并不会影响重复数据删除软件的相关功能。推出一体化方案的厂商,往往会在方案中增加一些该厂商特有的管理软件功能。

上一篇:自动精简配置:提升存储利用率有绝招 下一篇:CDP期待开花结果