电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

容灾备份技术范文

来源:火烈鸟作者:开心麻花2025-09-191

容灾备份技术范文(精选9篇)

容灾备份技术 第1篇

目前, 需要多种数据复制技术, 对容灾系统进行建设。对业务系统的需求和多种应用进行满足。而不管是怎样的技术, 对数据的保护是其关键和核心。伴随着日益发展的数据复制技术, 能够对数据的远程复制功能予以实现。一旦生产中心有灾难发生, 利用远程复制数据技术, 灾害中心在异地提供服务, 对核心业务系统的连续性做出保证。因此, 对容灾平台进行构建的核心, 是数据复制技术。

1 容灾备份的等级划分

具体来讲, 容灾备份是将一个冗余系统在建立在异地并进行维护, 利用地理上的分离, 对系统对灾难事件的抵御能力做出保障。根据发生灾难时, 容灾系统的抵抗程度, 可分为两类, 既应用级容灾和数据级容灾, 数据型容灾是将一个数据系统建立在异地, 实时复制本地系统关键应用数据, 而一旦有灾难出现, 由异地系统对恢复数据得以迅速实现, 进而对业务工作的连续性做出保障。应用级容灾比数据级容灾有着更高的层次, 即在异地建立一套备份应用系统, 相当于本地数据系统、并具有一定的完整性。而一旦发生灾难, 备份系统对全部业务工作迅速接管, 对应用系统的业务连续运行做出保证。如果在详细细分, 可以将容灾备份的等级按自动化程度和容灾能力的不同进行如下划分:

第0级:没有备援中心这一级容灾备份, 灾难恢复能力就不会产生, 它只在本地对数据进行备份, 并且只在本地保存被备份的数据, 没有向异地传送数据。

第1级:本地磁带备份, 在本地备份关键数据, 并在异地保存。一旦发生灾难后, 容易进行配置。由于数据的备份是有周期性的, 所以就会有数据丢失的问题发生, 若增大数据, 则就会有介质储存难管理的问题发生。同时发生灾难时, 则不能及时的恢复大量的数据。

第2级:热备份站点备份, 将一个热备份点建立在异地, 利用网络备份数据。以同步或异步方式通过网络将主站点的数据在备份站点备份, 备份站点不承担业务只备份数据,

而备份站点在灾难出现时, 可以完整地对业务数据进行恢复, 进而对业务运行的连续性做出保障。

第3级:活动备援中心。分别建立两个中心系统在相隔较远的地方, 它们相互进行数据备份, 并都处于工作状态。当某个数据中心有灾难发生时, 其工作任务就由另一个数据中心进行接替。根据投入资金的多少和业务要求, 这种级别的备份又可分为两种:

①可以采取主从方式, 两个数据中心之间只限于相互备份业务或关键数据;②数据保持实时同步状态、两个数据中心之间互为镜像, 即零数据丢失等。目前要求最高的一种容灾备份方式就是零数据丢失, 它要求无论是在任何一点发生灾难, 都可对业务连续性和系统数据的安全性做出保证。所以, 它需要对专用的硬件设和复杂的管理软件进行配置, 需要投资最快恢复速度的容灾备份的关键指标和技术, 在建立容灾备份系统时会有多种技术被涉及到。

2 容灾备份技术的应用

对一个容灾备份系统的建立, 与数据生产中心的特点结合, 是其技术应用的关键, 通过对多方面的因素的综合考虑, 对最佳的容灾备份设计方案进行确定。所以, 容灾备份技术应用的关键问题包括:备份中心的资金和管理、发生灾难时, 要求恢复的速度, 恢复数据量大小、备份中心之间和数据生产中心之间的距离, 设备保护程度等等, 这也是建设者和工程设计者首先应深入分析和了解的重要内容。

2.1 远程镜像

它是容灾备份的核心技术, 又叫远程复制。同时也是实现灾难恢复和保持远程数据同步的基础。远程镜像又可分为以下两类:

同步远程镜像 (同步复制技术) :是指将本地数据通过远程镜像软件, 以完全同步的方式向异地复制, 每一本地的I/O事务必须完成确认信息后, 才可释放并进行远程复制。同步镜像使远程拷贝相匹配于本地机要求复制的内容。一旦主站点有故障出现, 用户的应用程序向备份的替代站点切换后, 被镜像的远程副本能够对业务继续执行做出保证, 而没有丢失数据。但它的缺点是, 存在往返传播导致延时较长, 只能近距离的应用。

异步远程镜像 (异步复制技术) :在对远程存储视图进行更新前, 保证完成向本地存储系统的基本I/O操作。它是以后台同步的方式进行的远程数据复制, 较小的影响了本地系统性能, 有较长的传输距离, 对网络带宽有较小的要求。但是, 因为一些因素而导致数据传输没有正常进行时, 应对数据一致性的机制做出保障。

2.2 快照技术

远程备份的实现, 是通过快照技术与远程镜像技术的结合实现的, 即通过镜像在远程存储系统中备份数据, 再利用快照技术, 将远程存储系统中的信息在远程的磁带库中备份到光盘库中。快照是利用软件, 快速扫描要备份的磁盘子系统的数据, 并将一个要备份数据的快照cache和快照逻辑单元号LU N建立起来。在正常业务下, 利用快照技术可使用户在不受任何影响的前提下, 对当前在线的业务数据进行实时提取。其“备份窗口”和零接近, 可使系统业务的连续性大大增加, 保证系统真正的实现724运转。

2.3 互连技术

早期主要是基于SAN的远程复制, 来备份主数据中心和备份中心之间的数据, 即通过光纤通道FC, 连接起两个SAN, 在进行远程镜像 (复制) 。但有一些缺陷存在于这种远程容灾备份方式中, 如:较高的实现成本、相对较差的设备的互操作性、较短跨越的地理距离等, 这些因素对它的进一步应用和推广形成了一定的阻碍。目前, 有多种基于IP的SAN的远程数据容灾备份技术相对出现。它们是利用基于IP的SAN的互连协议, 借助于现有的TCP/IP网络, 利用远程复制, 将主数据中心SAN中的信息备份到备援中心SAN中。这种基于IP的SA N的远程容灾备份, 有较好的可扩展性、较低的成本, 可以跨越LAN、MAN和WAN, 其发展前景非常广阔。

2.4 虚拟存储技术

目前, 还有许多虚拟存储技术存在于某些容灾备份方案中。在系统和可扩展性和弹性上, 虚拟化存储技术上开创了新的局面。它串联不同的存储设备, 如几SCSI或IDE驱动器等为一个存储池。可将存储集群的整个存储容量分为多个逻辑卷, 管理的过程中作为虚拟分区进行。存储因此成为非物理属性的一种功能, 这主要是受限于基于服务器的存储结构。所以, 允许应用程序和异质系统共享, 是存储设备存储虚拟化的一个优势, 用户不管它们位于何处, 也不再需要在每个相对独立的服务器上, 就可对磁带备份设备进行分别连接。

3 结论

在信息化发展过程中, 必须高度重视和认真对待容灾备份系统, 它同时也是一项负责的系统工程。在设计容灾备份系统时, 还需要密切结合集中存储管理、系统整合数据生命周期管理和数据规划, 这样才能达到整体优化。针对当前的容灾备份技术, 本文探讨了它初步应用模式, 希望能对相关业务部门的工作起到一定的借鉴和启发作用。

参考文献

[1]刘家军, 刘顺.基于CDP技术的容灾系统设计[J].计算机安全.2013 (10)

[2]李冠艳.宁夏财政异地容灾备份中心建设的实践[J].中小企业管理与科技 (下旬刊) .2013 (09)

[3]马建忠, 杨文波, 李鹏, 刘天玉.基于镜像冗余技术的企业多系统数据容灾实现[J].河南冶金.2013 (02)

[4]沈潇军, 洪建光, 钟一俊, 沈志豪.基于SAN-Client的新一代备份架构探索及应用[J].电力信息化.2013 (02)

[5]蒋鸿城, 戚伟强, 裘炜浩, 洪建光.基于远程镜像的数据容灾技术在浙江电力的应用[J].电力信息化.2011 (11)

[6]杨栋.CDP技术在医院灾备系统中的应用[J].中国医疗设备.2011 (07)

[7]顾宇.构建企业信息系统的避风港——浅析企业信息化中容灾系统的建设[J].中国信息界.2011 (07)

容灾备份技术 第2篇

关键词:SAN;LAN-Free;快照;备份技术;容灾技术

中图分类号:TP309 文献标识码:A 文章编号:

1.引言

近年来,数据已经成为企业内IT系统架构的核心和关键。一方面,数据的存储架构必须满足海量数据存储发展的要求,以SAN(Storage Area Network)为代表的存储结构已经成为主流的存储架构。另一方面,客户对数据的安全性提出了更高的要求,因此数据备份技术和容灾技术已经成为数据保护的主要手段和方法。一般将备份技术应用在对本地数据的保护上,而对于数据和应用的异地保护,通常使用容灾技术。实际上这两种技术不是彼此矛盾的,完全可以通过备份、容灾结合系统实现两种技术的完美结合。本文通过设计BADR(Backup & Disaster Recovery)系统,实现容灾技术和备份技术的完美结合。

2.系统概述

本系统主要考虑数据的安全性和完整性,同时结合备份技术和容灾软件而设计。由于这套系统既有备份的功能,又有容灾的功能,故将这套系统定义为BADR系统。

BADR系统从功能上说有两部分组成,一部分是系统备份,通过设计备份策略、编写备份脚本程序,实现数据的本地备份和异地备份。备份策略主要包括数据库的全备份和增量备份。通过备份脚本,确保离线的数据保存在磁带机中。该系统的另外一部分是容灾功能,可以在本地生成生产卷的快照(或克隆),通过编写的同步脚本实现快照(或克隆)从本地到异地的传输。BADR系统既可以保护一段时间内的数据,又可以保护某一个时间点的数据。BADR系统的示意图如图1所示。

图1 BADR系统拓扑图

BADR系统逻辑层次上从低到高依次为存储层、基于存储的软件、光纤交换层、主机卷管理器层、数据层和应用层。下面依次说明各层实现的功能。

存储层:由两个磁盘阵列系统组成,存储层存放系统的核心数据,是整个系统的基础;

基于存储的软件:这一层由多个内嵌存储的软件构成,其中包括生成快照和克隆的软件;

光纤交换层:由光纤交换机、主机HBA卡等组成,这层主要担任数据的传输的任务;

主机卷管理器:这层负责组织、管理主机硬盘的容量空间;

数据层:主要存放所有数据,包括数据库的数据,操作系统的数据;

应用层:在本系统中主要指主机端运行的数据库,系统由SAN网络、以太网络组成。SAN网络由磁盘阵列系统、磁带库和两台光纤交换机组成。把两台磁盘阵列系统称为磁盘阵列A和磁盘阵列B,磁盘阵列A作为本地设备,磁盘阵列B和磁带库作为异地设备。在系统中把磁盘阵列A称为生产端,把磁盘阵列B称为备份端。在以太网络上,连接多台服务器(包括Window服务器、Unix服务器)。在备份客户端安装数据库,数据库的容量达到200G。这些服务器充当生产主机和备份客户端。

在磁盘阵列上安装快照软件和容灾软件,由快照软件生成生产卷的快照,由容灾软件完成在两台磁盘存储设备之间卷级别的数据复制。两端数据的一致性通过卷级别的数据复制得到了保证。磁带库连接到SAN网络,用来备份在磁盘阵列生成的快照。在备份服务器安装备份软件的服务器端,通过备份服务器端管理所有的备份作业和磁带库。

系统的主要实现通过磁盘快照技术、SAN备份技术和容灾技术。系统完成的主要功能有:

(1)通过备份软件对服务器运行的数据库做全备份,将该全备份集备份到磁带机上;对数据库在盘阵上的数据源Lun做快照,然后使用备份软件将快照备份到磁带机上。

计算并对比两种方法的时间。为了验证备份的完整性,分别测试将磁带机上数据库的全备份和快照Restore到原数据库,测算两种方法所用的时间。

(2)通过利用容灾软件,将磁盘阵列A的快照镜像到磁盘阵列B中。通过将该Lun绑定到主机端,来确认两端数据的完整性。

(3)使用容灾软件,将磁盘阵列A的生产卷的克隆镜像到磁盘阵列B中。通过将该Lun绑定到主机端,来确认两端数据的完整性。

3.BADR系统的模块设计

BDAR系统由三个模块组成,即:快照备份模块、镜像快照模块和镜像克隆模块。

快照备份模块实现两种备份技术的组合应用。首先使用基于LAN-Free的磁带备份技术对客户端的数据库作全备份,随后使用磁带机上的全备份集对数据库做Restore;第二组中先对数据库的数据源Lun做快照,然后利用LAN-Free备份技术将该快照备份到磁带库中,随后Restore该快照到生产机上运行的数据库中,使用数据库的回滚功能(Rollback)恢复数据库到某个时间点。

镜像快照模块实现容灾技术和快照技术的结合应用。在磁盘阵列A端对某个被镜像的Lun做的快照,可以通过容灾软件镜像到磁盘阵列B端。这样就保存了源端的Lun的某个状态。当然也可以使用LAN-Free技术把这个快照备份到磁带机上。快照具有数据量小的特点,一般快照只有源卷的20%大小,这样通过容灾软件传送的话,传送的数据量不大。本地模拟环境下传送20M的快照数据用时大约5分钟。在数据被容灾软件复制到异地后,通过备份软件备份该快照的镜像到磁带机。容灾软件具有反向同步功能,即把原来的备份端提升为生产端,从新的生产端向原来的生产端实时复制。当生产端出现故障后,可以先把快照使用Lan-free技术恢复到备份端盘阵,再使用容灾软件复制回生产端。这种数据保护方式的最大好处是在在生产端出现故障时,由于有生产端的快照存放在异地,可以使用这个快照恢复生产端数据到生成快照的时间点。快照被容灾软件镜像,也可以对该镜像进行备份。这样做带来的好处是备份过的快照又完全可以恢复到磁盘阵列B上,通过容灾软件还可以还原回生产端,也就是磁盘阵列A上。

镜像克隆模块将生产卷的克隆通过容灾软件镜像到备份端,然后再通过备份软件备份到磁带机上。这种技术是对生产卷的整个卷做了实时复制。由于克隆数据量要远大于快照,所以传送耗时要长。此外,克隆所需的空间是和源卷一样大小。容灾软件可以进行增量拷贝,就是把数据的改变量也同步到备份端的盘阵空间上。这样通过容灾技术,在备份端的磁盘空间总是保存最新的生产端数据卷状态。

如果空间允许,可以保留生产卷的两个副本,即本地的克隆卷通过容灾软件复制到备份端磁盘空间的镜像卷和本地克隆卷的镜像卷。尽管占用较多的空间,但是对于关键应用和关键数据来说,以空间的代价带来数据的安全也是值得的。

在数据备份和恢复过程中,如果结合使用盘阵的快照技术和LAN-Free技术,可以明显提高备份速度。相对单纯使用LAN-Free备份,这种两种技术结合使用带来的好处是显而易见的。它能明显提高备份速度,大大降低备份窗口的大小。在进行数据恢复时,时间也可以明显缩短。

将快照技术和容灾技术结合使用,可以保证在生产端出现问题时,利用已经备份在备份端磁带库中的生产卷快照,迅速恢复生产卷数据的状态。

4.BADR系统实现

系统实现主要通过两个软件工具,即RMAN备份脚本和CLI软件工具。RMAN是数据库提供的备份标准接口,通过编写RMAN工具来完成快照的备份和恢复;CLI软件工具是磁盘阵列提供的软件接口工具,通过CLI编写程序完成快照的生成和启动过程。下图是系统实现的框图:

图2 系统实现框图

利用RMAN进行备份恢复的条件是:

(1)建立一个recovery_catalog,存放RMAN使用和维护的目标数据库的信息,RMAN使用这些信息去决定如何执行备份和恢复的请求。

(2)目标数据库必须是在archivelog模式下运行。只有这样,日志才能归档,而RMAN正是利用归档日志进行数据恢复,所以这是一个必备条件。同时archivelog模式也是数据库在线备份的必备条件。

(3)RMAN备份中,如果采用磁带机备份,需要安装第三方介质管理库(MML)。恢复管理器保存在RMAN中注册的全部数据库的记录。当RMAN被用来启动备份或恢复数据库时,它将目标数据库与恢复目录中可用的数据库ID进行验证。如果条件一致,RMAN对目标数据库至少建立两个通道,其中一个通道只是对目标数据库的一个远程调用,使用PL/SQL接口来执行备份与恢复操作。

使用备份软件对数据库做全备份,见图3。

图3 数据库全备份

如上图所示,数据库在备份软件的控制下,备份到EXB-220磁带机中。备份方式采用数据库全备份方式,数据库容量约为200GB,完成备份所需时间为两个小时。

参考文献:

[1] 杨浩谰,黄开莉.存储区域网技术研究[J].北京:通信技术,2005,51(43):94-96

浅谈网络数据容灾备份技术 第3篇

1 网络数据所面临的常见灾难

计算机网络灾难事故的发生, 有一定的客观意外, 也有一定的主观人为因素。计算机网络灾难发生的主要原因有:人为因素、网络系统故障因素、计算机基础设施的故障因素、自然灾害等。其中, 人为因素往往是恐怖袭击、应用系统缺陷、植入有害代码、外来暴力事件、人为蓄意破坏、操作员操作失误/错误等;网络系统故障因素往往是由于病毒所造成;计算机基础设施的故障因素往往是指电信网络中断、软件错误、设备故障、电力故障等等;自然灾害主要有如台风、龙卷风、飓风、地震、洪水、火灾等所造成的计算机灾难。

2 网络数据容灾备份技术

网络数据容灾备份技术主要是为了建立一个整体全面的容灾方案, 从而保证网络系统中数据信息的可靠性和连续性。下面对容灾备份技术进行具体的分析。

2.1 数据容灾备份的概念

数据容灾备份主要是指在两个距离较远的地方, 分别建立几套彼此具有相同功能的IT系统, 这几套IT系统之间彼此可以相互监视和进行功能的切换, 如果某一套系统发生了灾难而停止运转, 此时整个网络系统将能切换为另一套系统进行运转, 从而使得网络系统能够持续的工作下去。数据容灾技术是网络系统应对外界环境对系统干扰的最有效措施, 尤其是能够应对灾难性事件所产生的IT节点的破坏, 它能有效提供节点级别的系统恢复功能。

2.2 数据容灾备份的方式

现状应用的比较多的数据容灾备份方式主要有为远程镜像磁盘、网络数据镜像、远程数据库复制、远程关键数据+定期备份、远程磁带库与光盘库、本地备份异地保存等六种。具体解释如下图1。

2.3 容灾备份的拓扑结构

中南财经政法大学有两个地点不同的中心机房 (即中南财经政法大学南湖校区机房和中南财经政法大学首义校区机房) , 在这两个校区机房的基础上从而建立网络数据异地容灾备份系统, 从而确保中南财经政法大学网络系统的有效、稳定、正常的运营, 确保关键业务数据的安全性, 具体设计方案如下图2。

在此方案中, 中南财经政法大学网络本门采用了EMC的CDP保护技术来进行网络关键数据的容灾备份和连续保护。首先, 在中南财经政法大学南湖校区数据中心和中南财经政法大学首义校区数据中心都统一学部署一台学EMC学480学存储学平台, 并且学配备学了一个学大容学量光学纤磁学盘存学储设学备, 作为学整个学系统学数据学集中学存储学平台学。其次, 再在两地都分别部署学两学台EMC学RecoverPoint/学SE RPA学, 采用学CLR学技术, 学即持续远程复制 (CRR) +持续数据保护 (CDP) , 从而实现两地并发数据的有效保护。再次, 在中南财经政法大学南湖校区数据学中心使学用EMC学RecoverPoint学/学SE学CDP学 (持续学数据学保护学) , 从而确保本地数据的安全性。最后, 在中南财经政法大学两个校区都使用持续远程复制技术, 即:EMC RecoverPoint/SE CRR, 以确保远程数据的安全性。因为两校区之间的专线所拥有的带宽比较有限, 因此可以采取异步复制技术 (EMC Recoverpoint/SE) , 将中南财经政法大学南湖校区EMC480上的数据进行定时复制, 将其复制到中南财经政法大学首义校区中。此时, 按照零带宽零的大小零, 如果后零期专零线带零宽有所零增加零, 零RecoverPoint零会零自动零切换零同步、零异步零、快照零时间零点三零种复零制方零式, 从而确保数据的最大安全化零。

2.4 数据恢复过程

首先, 本地恢复。本地恢复主要是在本地比如发生最终用户错误、病毒、软件错误、数据损坏、服务器故障等常见问题而产生的数据丢失, 通过本地CDP就能进行快速的恢复, 将其恢复至任意时间点的形态。

其次, 异地恢复。我们一般采取向地区相同应用服务器进行备份, 而进行异地恢复。在首义校区数据统中心统中配统置与统南湖统校区统系统统相同统的应统用服统务统器做统为备统用, 统一旦统南湖校统区本统地数统据中统心灾统难发统生, 统由于统数据已经统传送统到首义校区数据中统心, 我们统直接统将数统据附加统到已配统置好的统灾备统服务器上统, 配置统好网络统路由等细节统, 即可统启动应用, 统恢复原业务统系统统。

3 数据容灾备份技术的未来发展趋势

综上所述, 容灾备份的主要发展趋势之一是采用实时热备份技术。实时热备份技术能够保证良好的数据完整性与业务连续性, 其缺点是投资昂贵, 通讯费用高。其次是外包, 灾难恢复计划涉及到业务风险分析、方案的选择、实施、测试、培训、演习等内容, 是一项既繁锁并且复杂的工作。采用外包方式则可将灾难恢复计划交给专业计算机公司来完成, 金融企业则可专心从事银行的生产与经营。

参考文献

[1]王树鹏, 云晓春, 余翔湛, 胡铭曾.一种容灾中间件的设计与实现[J].通信学报, 2010, (7) .

[2]王德军, 王丽娜.容灾系统研究[J].计算机工程, 2011, (06) .

数据中心容灾备份方案 第4篇

医院备份、容灾及归档数据容灾

解决方案

1、前言

在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化 HIS、LIS 和 PACS 等系统是目前各个医院的核心业务系统,承担了病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。

随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于 15 年;住院电子病历保存时间自患者最后一次出院之日起不少于 30 年。

2、医院备份、容灾及归档解决方案

针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾

2.1 数据备份解决方案

针对于医院的 HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。

备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。

客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件 标准客户端,通过这个客户端完成每台服务器的 LAN 或 LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。备份介质层(内置虚拟带库):主流备份介质有备份存储或虚拟带库等磁盘介质、物理磁带库等,一般建议将备份存储或虚拟带库等磁盘介质作为一级备份介质,用于近期的备份数据存放,将物理磁带库或者光盘库作为二级备份介质,用于长期的备份数据存放。

2.2 应用级容灾解决方案

实时保护,可实现对医院信息系统中核心业务系统的持续数据保护。在核心业务系统应用数据写入被保护服务器自身存储的同时,写入存储设备中,颗粒度到秒级,最佳情况下可实现零数据丢失,通过镜像功能保证连接的磁盘阵列中的数据与被保护的数据完全一致。同时,利用截获每个写I/O 功能并进行记录,并且可基于时间点的快照进行回滚,此功能能够在被保护服务器发生逻辑错误时,快速有效地进行每 I/O 节点或快照点的挂载,避免逻辑错误造成的数据损坏。当存储系统宕机等灾难发生时,采用快速挂载功能,可以最快在分钟级别内迅速恢复前端应用或数据库服数据功能,保证业务的连续性。

分流器:截取主机写操作(块级别), 主机每次对被保护磁盘的写操作均被镜像写入到镜像数据写入过程在主机的主存储读写路径之外。

数据卷:保存主机分流器写入的所有数据。

记录卷和一致性代理:保存主机分流器写入的 I/O 记录根据应用特点 , 通过技术中的一致性代理实现对 ORACLE、MS SQL 等数据库在保存应用数据一致性快照使数据能够快速恢复到任意 I/O 记录。2.3数据系统长期归档解决方案

可通过高级备份功能,把电子病历、PACS 影像等数据备份到内置空间后,归档一份到光存储中,通过光存储的可长期保留特性,实现数据的长期保留(最长可到 100 年以上),满足法规要求。

2.4数据系统容灾解决方案

数据保护系统内置灾备功能,可实现数据及应用级别的容灾,可支持一对一,多对一等多种拓朴架构,系统可互为源端及目标端,完成异地备份、恢复功能。

1)数据级容灾:

备份数据保存在设备中,各备份点的数据可独立管理,可实现异机恢复,提高数据的安全性。

2)应用级容灾:

数据保护系统的 CDP 功能把数据持续保护在本地设备时,并可把本地CDP 数据复制一份到异地,CDP 的卷可以直接在异地直接挂载使用,结合虚拟机功能实现应用级容灾。

3、方案优势

数据保护系统提供的数据备份、CDP 及归档功能一体解决方案,满足医院信息系统的数据安全、应用级容灾及法规要求(电子病历数据长期保存的要求)的业务需求,解决方案优势如下:

1)软硬一体化结构,数据保护系统是多功能于一体的数据保护设备。包含了备份、CDP、存储(FC、ISCSI 及 NAS)及数据归档等多种功能,更加经济实用。并且部署简单,插入网线后进行简单配置后即可开始使用。

2)支持 FC、千兆及万兆网络等链路,灵活部署。

3)在同一台设备支持部署定时备份、CDP 功能,针对不同应用级别提供不同的保护方式。

4)具备远程复制功能,两台以上的设备可以实现远程复制,任意两台设备都可以作为发送端与接收端进行相互的远程复制,实现异地容灾,使数据更加安全。

5)具有高级备份功能,能实现 PACS 等大量的非结构化数据的不打包备份,可实现 100TB 级别以上的非结构化数据的光盘库出库归档,同时采用高级备份时光盘库恢复可通过备份系统和光盘库直接恢复等多种方式恢复方式,更加安全可靠。

容灾备份技术 第5篇

作为国民经济的骨干要素, 电力网络企业需要以保障系统的安全性与稳定性。考虑到企业的集中式运营特点, 且集中了各型并网发电机组、不同等级的输配电网络、各异的工业及生活用电需求, 电网的超大规模集中信息服务与控制系统一旦出现意外, 将带来难以估量的损失。企业容灾备份建设是一种有效的避灾手段, 其在系统崩溃时的备份机切入能够最大限度地介入控制企业数据与管控, 这种从断点准实时切入手段能维持系统业务稳定, 或者恢复系统断点状态[1,2]。

一、基础知识

1.1电网企业容灾备份。容灾备份描述了对企业业务信息进行必要的备份, 并在灾难发生 (系统业务异常) 时采用某种机制触发备份的业务信息进行系统重建的过程, 从而最大限度地减少损失, 保证业务恢复正常。一般来说, 灾备在三个等级上配置:数据级、应用级与业务级[3]。对于电网企业而言, 其中需要注意的是业务信息包括了管理控制台所辖的电力网络上发电量调度、输配电供给配置、终端用户等信息数据, 以及数据变化特征, 从而能够辨识网络是否异常, 触发灾备介入方案。

1.2国内外研究现状。国外的电网业务的容灾建设的相关研究工作始于上世纪60年代, 这个时期的核能发电技术才刚刚起步, 该时期的大多数的容灾以保护重要的发电设备为重要任务。Morgenstern 与Meier针对那核电设施的隐忧, 提出了安全考虑的思考与建议[4,5]。然而在世界政治与科技斗争严峻的格局下, 电网的建设迅速兴起, 小规模的电力网络不断合并壮大。专家学者也开始关注电网的稳定与保障能力。Kenney分析了美国这一时期的电力能源, 从发电设备上提出电网发电的能源材料需要多元化, 而不是单一格局, 从而避免自然灾害对电网运行的能源材料构成影响[6]。Bhattacharya以及Jones等人则详细地分析了电网的需求变化对应的供给随动特征, 从负载与发电平衡能力上提出了电网稳定的供需平衡方法[7,8]。Gaushell等电网线路的承载能力提出了详细的设计, 从而保证输电线路的安全可靠[9], 核电设施的安全保障研究在这一时期也非常突出, 大多数是从核电设备选型、发电厂选址、并网要求等方面考虑, 自然灾害的防范等方面需要注意的问题[10,11]。真正意义上的容灾备份建设则是在最近二十年, 依托传感器、计算机、通信同时发展的基础上建立起来的。如何通过灾备方案尽量避免此类重大事故具有极为重要的科学价值与现实意义。历史上的几次重大的停电事故 (2003年的北美大停电与核电机组保护性离网切除、2005年的莫斯科大停电与变电站停运、2007年哥伦比亚大停电、2011年韩国人为调控的轮流停电限电事故、2012年印度北方邦超高压变电站故障引发的网络过载导致电网崩溃等) 均造成了严重的后果。

国内的电网业务的容灾建设的相关研究工作始于上世纪80年代。张玲慧等提出了在架空线路上的适当位置上安装指示灯从而减少线路停电时间的故障指示仪, 提高线路检修的效率[12]。龚鑫森根据王二溪电站的水流特点提出了增容方案, 提高了机组出力[13]。大多数是从经济与能源的角度研究电网的优化调度, 如曹汉成提出的提高功率因数方案[14]、以及刘振东的九龙江流域整治等[15]。就完整的灾备而言, 国内的电网公司均开展了关键技术验证与系统研发工作, 南网广州公司实现了多服务器部署、存储设备的数据冗余备份、通信容灾备份等[16,17,18], 南网云南公司建设包括了营销系统、生产管理系统在内的15个业务应用系统, 国电上海容灾中心甚至将建筑信息模型技术应用于大型数据中心全生命周期工程建设, 促进了国内的电网企业灾备能力[19,20]。

二、南网海南公司数据容灾备份建设

2.1建设目标。南网海南公司承担着全省电网的安全生产工作, 保证全省电网的安全、稳定、经济、优质运行。海南省大部地处亚热带地区, 台风等自然灾害频发, 更有必要建立省网的数据容灾备份机制。需要以信息中心机房建设为硬件基础, 实现了同城的大部分数据灾备, 在南网系统中海南电网建设两个机房, 同化为一个数据中心, 互为容灾备份。从应用客户角度出发, 建设一个数据中心, 以一个虚拟数据中心的理念来提供达到所需服务等级协议 (SLA) 的服务, 其中的物理设施架构、距离对最终用户透明, 提供由一个数据中心得到所需的服务水平, 目标框架的其它组成部分为这个核心理念而组建。

海南电网信息中心的基础设施的构建的现实基础是两个机房 (及其网络连接) 建设, 规范化架构、标准与手段, 实现四个层面 (网络、应用服务、数据管理以及集中存储) 的虚拟化。采用存储区域网络一体化技术SAN (Storage Area Network ) [21], 使得原有的单一的SAN架构由紧耦合向松耦合转变, 双机房方案集成了Meta-SAN结构, 实际上组合成Double-SAN体系, SAN网通过SAN路由打通, 两个SAN网架构变更互不影响, 可实现跨机房数据迁移速度能达到200M/S, 如图所示。

2.2 建设内容。海南电网灾备最终需要实现建设云计算架构下的绿色机房, 具体而言, 需要实现基于X86平台应用服务器80%的虚拟化部署和管理;基于NETAPP共享存储以及Metro Cluster技术实现核心生产系统同城热备方式, 配合厂家进行技术验证, 实现核心生产系统的两地互活;完成数据迁移, 把原有HP EVA 8100以及NETAPP 3140上的数据库及应用数据迁移至NETAPP 3160;同时需要配合进行数据迁移过程中所涉及的业务层面的技术论证工作;根据规划设计、现状调研以及搬迁方案, 对原机房进行搬迁前的适应性调整, 配合进行整体网络环境的调整和重建;利用虚拟带库进行统一备份的配合工作;通过对网络、存储、主机、应用等基础架构的优化及设计, 满足未来2-3年的发展需要;在虚拟化演进的基础上建设并实施云计算管理平台, 实现未来云计算中的基础架构的IAAS云。

2.3支撑服务

2.3.1搬迁总体过程。整个的灾备建设项目过程划分为五个阶段:阶段一、网络实施阶段:完成新机房的网络实施, 以及与旧机房、外网的联调;阶段二、服务器虚拟化阶段:完成小型机、PC和存储的虚拟化以及联调工作;阶段三、业务系统数据迁移阶段:完成各业务系统的数据迁移, 包括各大业务系统数据库迁移到虚拟化的小型机中, 部分业务迁移到虚拟化的PC机中, 以及各业务系统的存储数据迁移, 形成核心业务系统在双机房进行双点运作;阶段四、剩余设备搬迁阶段:由于旧机房的装修, 在阶段三完成并稳定运行三个月后, 把旧机房的所有设备进行物理搬迁到新机房;阶段五、部分设备回迁:待旧机房装修完成后, 为了实现核心业务系统双机房容灾, 把部分设备回迁至旧机房。 (说明:本阶段的工作不在本项目中实施) 。

2.3.2搬迁总体过程。为了能够安全、可靠的完成搬迁工作, 必须在前期进行大量的调研、分析和设计;其中的业务搬迁工程保障设计就是非常重要的一环, 它是所有搬迁方案的设计基础, 概要内容如:系统迁移前提条件验证、系统迁移顺序、与业务部门的沟通安排设计、系统迁移数据同步方式、数据一致性验证方式、系统迁移过程中验证点设定、系统迁移时间窗口、系统迁移成功确认方式和系统迁移后业务运行方式等。

以上内容和设计是在项目执行过程中的不同阶段, 通过不同方法、步骤分析和总结得出的, 通常体现在搬迁项目的如下过程或文档内:系统迁移前提条件验证以搬迁前Check List方式体现;系统迁移顺序通常采取“先易后难、先简后繁”的搬迁顺序, 但需要根据业务关联性和整个目标机房的设计为根本背景;与业务部门的沟通安排设计将按照项目的沟通管理, 进行全面、有效的沟通管理;系统迁移数据同步方式有很多种, 但合适和方法用在合适的场合下, 才会最有效;数据一致性验证方式推荐采用具有一致性保障机制的数据迁移技术和工具;系统迁移过程中验证点设定体现在搬迁的过程控制文档内, 确保搬迁的关键环节不被遗漏、忽视或出错;通过业务连续性分析和设计, 可以综合考虑每个业务搬迁过程中的影响和风险, 并结合投资/收益率, 规划系统迁移的时间窗口;此时间窗口的规划不能仅考虑单个系统, 应着眼全部系统的搬迁安排, 在符合大的项目搬迁进度的前提下, 选定最佳迁移时间, 以达到尽量消除、规避或降低搬迁影响。系统迁移成功确认是以一系列工作确认文档为前提的, 也可以认为是多项迁移工作的成功确认, 如《搬迁后系统健康检查报告》、《业务运行监控报告》等。系统迁移后业务运行方式根据性能和功能等方面要求进行一些微调, 以提供最优的业务服务。

2.3.3安全保障方案设计。除了上述的保障设计内容外, 还需要对整个搬迁过程的搬迁前、搬迁过程中和搬迁后三个阶段进行详细的安全保障方案设计, 主要包含如下三方面的设计:

测试方案的设计。通过搬迁前的系统调研和方案设计, 制定海南电网绿色机房整合优化和搬迁过程中的情景测试方案和测试用例, 确保方案中的技术点可行并符合应用场合的要求, 从中发现可能的潜在威胁;同时, 针对多种可行的技术进行测试对比, 找出最符合本项目的技术手段, 以最小的代价实现最优的效果;以上测试要根据不同的测试内容搭建测试环境, 并充分考虑使用现有可利用的利旧或新购设备来实现。

应急方案的设计。结合业务连续性分析和设计, 针对每个系统的搬迁方法和搬迁特点, 充分考虑各种搬迁中的风险因素和测试中发现的潜在威胁, 进行风险分析, 并按照分析结果进行有针对性的应急方案设计;对此, 应建立风险管理流程, 明确分析和设计应急方法的启动条件和分析方法, 并且协助客户搭建应急系统, 保证系统在搬迁过程中出现突发事件, 通过应急方案以保证业务系统能够正常运行。

回退方案的设计。在风险管理流程中, 同时包括建立回退方案的设计以及回退条件的分析和设计方法, 并在搬迁方案中, 针对搬迁的每一个关键环节, 考虑回退的可行性、准备措施、步骤间的配合等, 保证业务系统在出现问题, 采用应急方案失效时, 能够进行有序的业务回退, 在搬迁方案内应该标明可回退和不可回退的操作区间, 并在不可回退的操作区间内, 充分考虑操作的安全性, 在技术和审核上严格把关, 制定充分的应急方案和应急措施。

三、电网容灾备份的关键技术与挑战

电网容灾备份的关键技术随着高性能计算机硬件、应用软件、存储设备以及网络的发展, 其关键科学技术问题也在发生变化, 根据操作阶段可以将涉及的关键技术划分为数据备份、灾难检测等[23], 根据实际的问题而言, 可以划分为以下三类。

3.1硬件与体系架构。硬件基础设施包括高性能计算机 (服务器) 、电流电压等物理量监测仪表 (传感器) 、存储器 (磁盘阵列) 、网络控制器 (交换机) , 并由这些硬件设备集体构成的灾备体系架构。一般来说, SAN体系结构较为常用, 但是为了得到更佳有效的灾备应急能力, 计算机性能、存储阵列以及网络外设硬件需要不断调试匹配[24]。

3.2 网络与通信服务。网络与通信服务是灾备的重要信息通道, 这里主要指两方面的内容。首先, 灾备系统日常运行备份需要通畅的数据传输链路, 从而实时或准时实地将业务数据存储到备份机上;其次, 灾备系统灾备运行时, 需要以最快的速度还原系统状态与业务数据, 这对网络通信也提出了较高的要求。

3.3触发运行机制。触发运行机制是灾备的决策层。通常而言, 灾备运行的触发无非是两种方式, 一种是人为介入, 往往伴是出于人工调控检修或者原系统已经崩溃;一种是自运行, 这就需要编写具有判断决策的软件程序来引导操作[25], 在环境日趋复杂的电网系统中, 这是一项较为复杂的工作。

四、结论与展望

电网的灾备是国民经济发展的重要研究内容。国内外对电网灾备的研究从无到有、从有到精, 提出了针对不同环境背景下的灾备问题, 形成了较为成熟的灾备技术方案。本文以南网海南公司的数据中心建设与基于Meta-SAN的技术应用, 实现了高速的跨机房数据迁移速度, 大大提高了系统业务的容灾能力, 提高了业务运营水平。

容灾备份技术 第6篇

计算机技术的发展可以分为三个方向:第一个方向围绕计算处理技术展开,推动计算机技术的普及应用;第二个方向围绕信息传输技术展开,推动信息数字化时代的到来;第三个方向围绕信息存储技术展开,逐渐提升信息的安全性和高可用性。近年来随着社会对信息的依赖程度日益加深,对第三个方向也就是信息存储方向容灾备份技术的研究逐渐成为研究的热点。容灾备份是保护IT系统中重要数据和保障系统业务连续性所做的冗余工作,按照距离分为本地和异地容灾,按照功能分为数据级容灾和应用级容灾。该文介绍并分析不同应用背景下的容灾备份技术,同时例举出所对应的市场产品和解决方案[1]。

2 容灾备份技术的体系结构

本文从容灾备份不同的应用背景,将容灾系统分为本地数据容灾、本地应用容灾、异地数据容灾和异地应用容灾[2]。提出容灾本文从容灾备份不同的应用背景,将容灾系统分为本地数据容灾、本地应用容灾、异地数据容备份技术体系结构,如图1所示。1

3 本地容灾

本地容灾适用于区域范围小、容灾级别并不很高的环境,通过对业务系统的有效冗余和对失效点的切换来实现。包括两方面内容,一方面通过各个环节要素自身的可靠性来实现本地数据容灾,另一方面通过生产中心冗余系统实现本地应用容灾。

3.1本地数据容灾技术

RAID[3](磁盘阵列)提出将若干磁盘条纹化组成一组虚拟的整体存储空间,从而可以执行磁盘并行I/O操作,提高存储性能。一般分为六种结构分别是RAID0~5,RAID0在存储性能上得到提升,没有容灾作用;RAID1即镜像技术,通过额外数据拷贝达到容灾的效果。工作原理如图2所示:生产系统发出数据写命令,并传给镜像系统,镜像系统执行数据镜像任务,拷贝数据到介质,镜像技术也可以利用互联技术如SAN等达到远程镜像目的;RAID2利用海明码纠错布局,在RAID1的基础上增加一个校验盘起到容灾目的,存储粒度为bit,;RAID3~5利用校验布局,当一个磁盘发生故障可以通过磁盘之间的校验关系还原失效磁盘数据。

3.1.1 网络存储技术

传统存储方式为DAS(Direct-Attached Storage)方式,即服务器直接与存储设备连接,这种方式已经难以满足扩展性和高可用性的需求,因此网络存储技术得到迅速的发展,包括NAS(Network-Attached Storage),SAN(Storage Area Network)和基于IP的存储。

NAS是以网络文件服务器为模型,利用以太网的数据访问技术。用户可以直接使用它预先配置好存储空间和进行网络文件访问。NAS访问速度优于DAS,而且NAS发生故障并不影响主服务器的其他操作,具有一定容灾能力。NAS的结构如图3所示,拥有异构型强,利用现有LAN网络资源节约预算,易安装和广泛的连接性等优点。不足之处是文件访问速度不能满足在线处理,可扩展性差,数据备份占用LAN带宽等。

SAN一种利用FC(Fibre Channel)等高速互联协议连接起来的, 可以在服务器和存储系统之间, 或者在存储系统之间直接传送数据的网络。SAN如图4所示,在原有LAN的基础上建立一个专用的存储网络,分离了存储和传输避免网络拥塞。独特的结构设计和专用协议是SAN具有高速存取,良好扩展性等优点。但是利用FC协议传输的FC-SAN也存在局限性,包括FC协议下不同厂商设备互操作性较差,系统构建费用昂贵,存储系统异构兼容困难等,严重阻碍了SAN的发展。当传统FC-SAN发展遇到瓶颈是, 通过IP网络协议完成SAN互联成为研究热,这一部分将在互联技术详细讲解[4]。

3.1.2快照技术

快照技术[5](Snapshot)是指关于指定数据集合的可用拷贝,它包括相应数据在某个时间点(的映像),能够进行在线数据备份与恢复,为存储用户提供了另外一个数据访问通道。快照的实现层次一般是在卷管理层和物理层,分为第一次复写时复制和I/0重定向两种方式。快照通常完成本地存储系统信息备份到本地磁带库的功能,完成以数据快速复制过程。

3.2本地应用容灾技术

当灾难发生时,本地数据容灾技术虽然保证了数据的安全性,但是不可避免会造成系统应用的暂停,在这一点上已经不能满足人们对重要业务提供连续不间断服务的需求,因此需要本地应用容灾技术提高信息系统的高可用性,消除单点故障,当发生灾难时可以在用户不可察觉的最短时间迅速接管业务,确保服务连续性。本地应用容灾技术主要通过配置多机环境来达到高可用性,分为双机热备份技术和本地集群技术。

3.2.1双机热备份

双机热备份技术是指在本地服务系统中,采用两台服务器进行冗余容错,并分为主从服务器。通常情况下,主服务器提供服务,而从服务器与主服务器保持一致的工作状态但是并不提供服务,当主服务器发生宕机,从服务器迅速向系统提供服务。在具体应用中,也可以选择双服务器互为备份同时向外输出服务。

3.2.2本地集群

本地集群技术是由三个以上独立的计算机系统构成的一个相互协调的群组,作为一个整体对外提供服务。集群系统的其处理能力、I/O性能和高可用性都有大幅提升。集群中每一台服务器称为一个节点,当其中某个节点发生故障时,集群会利用基于IP重定向的应用迁移技术将此节点业务转移到其他服务器执行,具体执行过程将在本文后续给出。

3.3本地容灾产品介绍与方案分析

鼎联公司研发的Lander Cluster多节点集群一备多和多机互备模式容灾解决方案,是利用高可用集群软件对系统和数据进行重新规划,将数据库、文件系统存放在系统盘上。利用集群软件对存储资源进行控制,当遇到系统故障,则将故障点交给规定备援服务器工作,PTO恢复时间目标系统恢复时间在几十秒。

飞康公司CDP(Continue Date Protection)实时备份方案,利用飞康IPStor存储虚拟化平台和多时间点自动连续快照技术,实现I/O级别的备份粒度和分钟级恢复数据,而且极少占用主机和网络资源。

智网科技业务应急系统,利用差异快照技术,IP-SAN存储技术和内置虚拟化平台完成数据在线复制,应急系统自动化去主机信息实分钟级别现应急接管业务 ,是一种高性价比应用容灾手段,方案局限性在于RPO恢复点目标较大。

本地容灾可以有效解决单点故障问题,但是它的局限性在于不能避免大规模毁灭性的灾难,如地震、火灾、洪水战争等。单纯的本地容灾不能全面地保障业务连续,此时异地容灾技术成为全面容灾方案的主要手段,下面对异地容灾技术进行阐述。

4 异地容灾

异地容灾是指生产中心与备份中心在设计保持一定物理距离,通过远程容灾技术保障数据安全和业务连续性,在技术上分为两个层次:异地数据容灾和异地应用容灾。

4.1异地数据容灾技术

异地数据容灾技术指将本地系统的数据在线备份到异地数据系统保存,当本地发生灾难时,异地数据可以用来完成数据重构,起到保护业务数据作用,但是不可避免的会发生业务暂停。异地数据容灾技术有虚拟存储技术和互联技术。

4.1.1互联技术

IP存储技术作为主要互联技术[6],通过IP网络完成类似SAN的块级数据传输, 分为通过IP网络进行FC-SAN互联和直接构建以IP网络协议为传输协议的IP-SAN两种方式。与传统总线协议SCSI相比IP网络存储协议FCIP(Fibre Channel over IP)、IFCP(Internet Fibre Channel)和ISCSI(Internet SCSI)具有如下优点:主机与外设分离提高安全性、实现了资源灵活配置和使用、实现高性能I/O。FCIP和IFCP是利用网络将FC-SAN互联的协议,在IP网络和FC-SAN衔接处需要进行协议转换,增加系统复杂性。

而ISCSI定义了总线协议SCSI到IP上传输的映射,相当于在IP网络上传输SCSI协议,从而达到通过网络进行I/O操作的目的。如图5所示,ISCSI可以在IP网络上创建一个共享存储环境,利用发达的IP网络线路作为传输通道节约成本并克服了FC-SAN传输距离的限制,将I/O操作从局域网扩展到广域网。

4.1.2虚拟存储

存储体系从DAS发展到NAS、SAN甚至到IP存储,ISCSI协议将从总线连接扩展到网络连接,规模变得越来越大,结构变得越来越复杂,不得不面临存储子系统的异构共存问题,而虚拟存储技术正是高效管理大规模存储系统的有效手段。虚拟存储将不同存储介质和不同结构的存储子系统通过软硬件手段统一到用户存储应用的技术,可以实现存储管理自动化与智能化,从而提高存储效率、节约成本。

虚拟化[7]实现需要在存储系统中加入一个新的虚拟化层,根据虚拟化层的位置可以划分为在服务器端、在存储设备端和存储网络上的虚拟化:

基于服务器的虚拟化将虚拟化层放在SAN中的服务器上,通过改造操作系统或者添加映射虚拟化层来实现。这种方法不需要特殊硬件,以软件模块的形式将虚拟化层嵌入到应用服务器操作系统中,不足之处在于受SAN软硬件环境制约,软件模块需要具备嵌入不同操作平台的能力。另外此虚拟化方法是通过多服务器分布式操作实现的,任何一个服务器的不当操作会影响数据资源的完整性。

基于存储设备虚拟化将虚拟化层放在存储设备的控制器中,这种虚拟方式充分考虑存储设备的物理特性,从虚拟化存储中解放应用服务器,达到很高的存储性能。但是这种方法局限于存储设备的同构环境,而且价格高昂,系统调试管理权限必须交给存储设备厂商。

存储网络上的虚拟化通过网络智能路由器、交换机,或者增加专用服务器等方案来实现,这种技术是目前虚拟化技术的主流。

1) 基于交换机的虚拟化将虚拟化曾直接放置于交换机,通过改造或添加中间件的代码使交换机同时完成交换功能和虚拟化功能,为了提高交换机的性能普遍采用缓存技术和优化的缓存调度算法。

2) 基于存储路由器的虚拟化是随着SAN存储路由技术发展起来的,与存储网络中的交换机相似,具有路由功能和虚拟化功能,通过完成协议转换连接不同存储网络。这种方法不需要增加服务器软件模块,减少主机负载和复杂度,而且通过网络中多点路由器还可以解决单点失效问题。不足之处在于路由器投资较大。

3) 基于专用服务器的虚拟化方式是在SAN中采用一台元数据服务器,只负责提供存储虚拟化。当应用服务器所需数据不在本地存储空间中,向专用虚拟存储服务器发出申请,专用服务器将所需数据相关信息发送给该应用服务器,且在此服务下次访问同样数据时无须申请便可直接存取,大大提高性能。

4.2 异地应用容灾

一套完备的容灾系统除了要提供异地数据级保护,还需要完成业务的异地转移提供应用级的容灾,这样才能保证业务高可用和连续性。应用容灾的目的是保证业务的无缝迁移,使用户察觉不到产生服务系统的位置变化。应用级的容灾是在数据级的基础上增加对整个业务的备份,相关技术包括:失效检测技术和服务迁移技术。

4.2.1失效检测技术

失效检测表现一种未雨绸缪的主动性而不是灾难发生后“亡羊补牢”的被动性,目前主要灾难检测方法有心跳技术和检查点技术。心跳技术是系统各个重要节点每隔一段时间都要向外广播自身的状态,如果周期内节点广播消失则证明此节点失效。检查点技术为主动检测手段,是每隔一段时间会对系统重要节点进行检测,若周期内被检测节点没有响应,则认为检测节点失效。两种方法都存在周期问题,如果周期太频繁,会影响系统性能,占用系统资源;如果间隔时间过长,检测不灵敏,增加容灾难度和任务量。

4.2.2系统迁移技术

系统迁移技术[8]是保证灾难发生时实现系统透明的迁移,利用备用系统透明的代替生产系统,以保证业务连续性。系统迁移技术主要分为基于DNS的迁移、基于IP重定向迁移和基于集群的迁移。

基于DNS迁移技术利用动态域名解析系统完成业务迁移,实时性较差;

基于IP重定向迁移技术利用重定向设备实现容灾自动切换,智能性较高其,原理如图6所示。

基于集群迁移技术指集群中任意节点出现故障,这个节点服务器的业务将由另一台服务器承担,保证业务连续性,且成本较低。

4.3 异地容灾产品与分方案析

4.3.1 异地数据级容灾产品与方案

VERTIAS利用卷管理器将数据以异步或是同步方式通过IP网络复制到远程系统,无须复杂硬件和专用线路,复制过程占用主机性能。

IBM利用ESS企业存储服务器和PPRC(Peer to Peer Remote Copy)点对点远程复制技术的数据容灾方案。PPRC以存储为基础,提供实时、同步与应用无关的数据容灾方案。通过专用ESCON通道完成本地ESS存储服务器到异地ESS的数据传输。

西北工业大学李战怀等人建立一个基于Linux平台的数据容灾系统——DDT(Data DisasterTolerance System on Linux)。DDT系统通过Linux内核嵌入远程实时复制和灾难恢复机制,实现用户数据的动态复制和灾难恢复,并结合快照备份机制,实现很高的数据容灾能力。

四川李涛等人实现基于Internet的跨平台远程容灾系统,并提出一种基于Internet的大型文件镜像模型,具有同步异步切换功能,能够适应多种网络状况,具有良好容错能力和较强实时性。

这些模型和系统融合了SAN、NAS、镜像、RAID、集群等技术实现不同形式的复制过程。主要区别在于所使用的数据传输技术不同。

4.3.2异地应用级容灾产品与方案

浪潮公司研发的HA Cluster集群应用容灾设计方案,通过任意热备服务器接管宕机服务器,集群热备服务器不是固定的,而是根据服务器设定的优先级和互斥性决定的。方案中在软件设计上用Heart Beat作为信息交换枢纽,实现全面监控和失效监测。在监测环节引入“浮动IP”概念,避免失效切换引起的目标服务器的切换。

数腾公司研发的CDAP持续数据应用保障设备可以提供实时容灾25台本地或异地服务器,产品基于底层卷完成实时数据备份,结合虚拟化技术和专业的迁移工具实现多点容灾和接管业务,具有一定的硬件结构一体化性和系统兼容性。

5 结束语

容灾备份技术 第7篇

众所周知,数据是企业很宝贵的财富,数据对于企业来说是非常重要的,尤其对数据信息依赖程度很高的企业更是相当重要。而数据备份重于一切,这点我们必需知道,数据备份几乎是任何计算机系统中绝对必需的组成部分,意外断电、系统或服务器崩溃、用户失误、磁盘损坏甚至数据中心的灾难性丢失都可能造成数据库文件的破坏或丢失,而这些文件往往包含着珍贵的数据,经不得任何损失。美国“9.11”事件造成的世贸大楼的数据灾难更深刻地揭示了这个道理。灾难发生前,约有250家企业在世贸大厦中工作,事故发生一年后,重返世贸大厦的企业变成了150家。有200家企业由于重要信息系统的破坏,关键数据的丢失而永远的关闭、消失了。而同样是在世贸大厦的金融界巨头摩根斯坦利公司在事发几个小时后,就宣布全球营业部可以在第二天照常工作,原因就是该公司建立的数据备份和远程容灾系统,使得公司的重要数据得以保存。由此可看对于信息时代的现代企业而言,当灾难来临时,做好容灾备份至关重要。

2 数据容灾备份

容灾备份是通过在异地建立和维护一个备份存储系统利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。根据容灾系统对灾难的抵抗程度,可分为数据容灾和应用容灾。[1]数据容灾是指建立一个异地的数据系统,该系统能对本地系统关键应用数据实时复制,当出现灾难时,可由异地系统迅速接替本地系统而保证业务的连续性。应用容灾比数据容灾层次更高,即在异地建立一套完整的、与本地数据系统相当的备份应用系统,在灾难出现后,远程应用系统将迅速接管或承担本地应用系统的业务运行。

3 Data Guard概述

Data Guard最原始的版本是在Oracle 7中实现的,那时被称为Standby Database,但这个版本却不能实现归档日志的自动传送,而是需要手工或者编写脚本程序来实现归档日志的传递并没有被广泛使用。经过Oracle 8i改进,Data Guard技术真正大量的使用,是在Oracle 9i数据库中,目前又经过Oracle 9i R2、Oracle 10g版本对Data Guard技术改进和加强,已接近完美,不仅能实现物理备用数据库的实时备份查询,而且还能支持对物理备用数据库的读写操作,同时也实现了高速备份和恢复等先进的功能。

在众多的容灾解决方案中,Data Guard技术是当中的姣姣者。Data Guard是内置于Oracle数据库的一个功能模块,是管理、监控自动化软件的基础架构,它创建、维护和监控一个或多个备用数据库,以保护企业数据结构不受故障、灾难、错误和崩溃的影响。Data Guard使备用数据库保持为与生产数据库在事务上一致的副本,这些备用数据库可能位于距生产数据中心数千英里的远程灾难恢复站点,也可能位于同一城市、同一校园乃至同一建筑物内。当生产数据库由于计划中断或意外中断而变得不可用时,DataGuard可以将任意备用数据库切换到生产角色,从而使与中断相关的停机时间减到最少,并防止任何数据丢失。

4 Data Guard关键技术

如果要使用Data Guard技术来为Oracle数据库实现可靠的容灾备份,就需要对Oracle数据库的一些相关技术和重要概念有较为清晰的认识。

4.1 重做机制(Redo)

重做机制是Oracle数据库避免数据出错以及实现容灾的基础。重做机制的实现分为在非归档模式下和归档模式下。非归档模式下,数据库只能从非正常关机、停电等一般的数据库存错误中恢复;而在归档模式下,数据库存可以实现基于时间点恢复、基于改变的恢复等所有情况下恢复丢失的数据,从而达到吃“后悔药”的效果。

4.2 联机重做日志(Online Redo Log)

无论在非归档模式还是在归档模式下,联机重做日志都是必须存在的。它以循环的方式记录了所有对数据库的更改记录。它至少要由两个联机重做日志文件组构成。在Data Guard备用数据库上还存在另一种类型的联机重做日志,被称为Standby Redo Log,它主要用于实现数据的同步。

4.3 归档重做日志(Archive Redo Log)

只有系统运行在归档模式下才会生成归档重做日志文件。每当联机重做日志切换到下一个联机重做日志组时,系统就会把上一个联机重做日志生成一个脱机副本文件,这个文件就是一个归档重做日志。归档重做日志是实现“后悔药”的必要条件之一,如果要完全恢复数据库,还需要数据库的完整备份,Oracle 10g的Flash Back技术也能达到数据回滚的目的。

4.4 数据库常用的备份数据库

Oracle数据库的备份方式分为:逻辑备份,它就是指用IMP工具进行导出备份,但是这种备份会丢失部分物理结构,比如索引、视图等;另一种就是物理备份,它是利用如RMAN、OS Copy等工具对生产数据库存进行无损的备份,这种物理备份也是建立DataGuard必须用到的技术。Data Guard能实现容灾和备份,是通过物理备用数据库和逻辑备用数据库来实现的,如果生产数据库出现故障,就可以把物理或逻辑备用数据库切换为生产数据库;如果,要对生产数据库进行硬件升级,就需要把当前的生产数据库切换为物理或逻辑备用数据库。

4.5 Data Guard保护模式

Oracle Data Guard提供了三种高水平的数据保护模式来平衡成本、可用性、性能和事务保护。[2]

(1)Maximize Protection(最大保护):是指主数据库提供了最高水平的数据保护,从而确保了一个全面的零数据丢失灾难恢复解决方案。当在最大保护模式下运行时,重做记录由日志写入进程从主数据库同步地传输到备用数据库,并且直到确认事务数据在至少一个备用服务器上的磁盘上可用时,才在主数据库上提交事务。这种模式必须配置至少两个备用数据库,从而提供双重故障保护。当最后参与的备用数据库不可用时,主数据库上的处理将停止。这就确保了当其所有备用数据库失去联系时,不会丢失事务;但如果网络不通畅,会引起LGWR不能传送数据,将引起严重的性能问题。

(2)Maximize Performance(最高性能):是默认的保护模式,它与最高可用性相比,提供了稍微少一些的主数据库数据保护,但提供了更高的性能。在这种模式下,当主数据库处理事务时,重做数据由日志写入进程并异步传输到备用数据库上。在任何情况下,均先完成主数据库上的写操作,主数据库的提交操作不等待备用数据库确认接收。如果任意备用目标数据库变为不可用,则处理将在主数据库上继续进行,这对性能只有很小的影响或没有影响。当主数据库上的可用性和性能比丢失少量数据的风险更重要时,应该使用最高性能模式,

(3)Maximize Availabilit(最高可用性):亦称无数据丢失模式,它允许数据分歧,允许异步传送。正常情况下运行在最大保护模式,在主数据库与备用数据库的网络断开或连接不正常时,将自动切换到最大性能模式,主数据库的操作还是可以继续的。在网络不好的情况下有较大的性能影响。

如果实现Data Guard技术的容灾和备份,以上技术至关重要,企业相关管理员必须要掌握。

5 Data Guard工作原理

5.1 Data Guard的进程结构

在主数据库上,Oracle Data Guard使用日志写入器(LGWR)或归档进程(ARCH)收集事务重做数据,并将其传输到备用数据库中;使用获取归档日志进程(FAL)提供一个客户服务器机制,用于在主数据库和备用数据库之间出现通信中断之后,将存档日志发送到备用数据库中,以实现自动填充间隔和重新同步。[3]

在备用数据库上,Oracle Data Guard使用远程文件服务器(RFS)进程从主数据库接收重做记录;使用管理恢复进程(MRP)将重做信息应用到物理备用数据库中;使用逻辑备用进程将经过SQL转换的重做信息应用到数据库中。

5.2 物理备用数据库工作原理

如果生产数据库运行在Maximize Protection模式,那么其上的LGWR进程不仅会非常频繁地把重做日志中的更改记录写入联机重做日志,同时,它也会通过物理备用数据库上的RFS进程写入备用重做日志。接着如果生产数据库上的联机重做日志发生日志切换,生成归档重做日志,那么它也同时会触发物理备用数据库上的备用重做日志发生日志切换并生成归档重做日志,如果这时物理备用数据库被设置为管理恢复模式,那么物理备用数据库就会使用MRP进程同步地把这些生成的归档日志恢复到数据库中,从而完成对生数据库实时的无数据丢失的备份。但是在这种模式下,每次数据的更改总是在两个数据库上同时提交,因此如果物理备用数据库出现任何故障,生产数据库也会受到很大影响,比如物理备用数据库死机,生成数据库也会同时死机。

如果生产数据库运行在Maximize Performance模式,Data Guard的默认情况下,生产数据库会在联机重做日志发生日志切换并生成归档日志的同时,由ARCH进程把数据传递到物理备用数据库上,再通过其上的RFS进程直接生成归档重做日志,最终,MRP进程会把归档日志恢复到物理备用数据库,从而完成数据的备份。可以看出,这种模式下,物理备用数据库与生产数据库是不同步的,即使在正常情况下,也会存在一个当前联机重做日志的差距,因此,用这种方式备份会出现数据的丢失。[4]

如果生产数据库运行在Maximize Availability模式,那么在正常情况下数据库的工作方式与Maximize Protection模式下是相同的,但是,如果物理备用数据库出现故障,那么生产数据库会自动切换到Maximize Performance模式。

建议如果只有一台物理备用数据库,采用第三种方式运行最好;如果有更多的服务器,那就可以同时采用第一种加上第三种的运行模式,这样就保障了数据的最大可用性。

5.3 逻辑备用数据库工作原理

Data Guard如果部署为逻辑备用数据库,那么,生产数据库只能工作在Maximize Performance和Maximize Availability两种模式,并且逻辑备用数据库不支持备用重做这种日志结构,因此,这种方式下会出现数据的丢失。

当生产数据库运行在Maximize Availability模式下,其上的LGWR进程接通逻辑备用数据库的RFS进程,并以同步方式将重做日志缓冲区中的数据写入逻辑备用数据库的归档重做日志。当生产数据库发生联机重做日志切换时,也会同时触发逻辑备用数据库上归档日志的切换,然后LSP进程(采用Logmnr技术)把这些归档日志解析为SQL语句并恢复到逻辑备用数据库中,就完成了备份工作。逻辑备用数据库虽然不能像物理备用数据库那样实现无数据丢失的备份,但是,它却能实现异步查询功能,因此它可以分担生产数据库的部分查询任务。

逻辑备用数据库的Maximize Performance模式与物理备用数据库的Maximize Performance模式类似。

6 结束语

Oracle Data Guard容灾技术所具有的优点,非常地显而易见,它具有很好的可靠性,高安全性,对性能的影响非常小。当数据库机器出现故障时,只需要几分钟就可以使数据库照常运行,数据的丢失率几乎为零。这种容灾方式的实用性决定它将来的发展前景是非常广阔的。

摘要:论述了数据容灾备份的概念以及了DataGuard概述,从DataGuard关键技术、工作原理等方面分析了Oracle DataGuard容灾技术的高可靠性和高安全性。

关键词:数据库,DataGuard,备份

参考文献

[1]吴清明.浅谈Oracle数据库容灾中数据的传输方法[J].现代计算机,2003(2):59-60.

[2]龚艳.用Oracle9i dataguard构建系统容灾[J].计算机应用与软件,2006,23(10):66-68.

[3]黄健.基于Oracle Data Guard的容灾策略设计与实现[J].科技广场,2006(11):71.

容灾备份技术 第8篇

关键词:虚拟化,容灾,备份

一、容灾异地备份概述

1、概论

虚拟化技术为灾难异地备份的发展起到了很大的作用。在容灾异地备份系统建设中虚拟化软件的优势是十分明显的。通过允许虚拟机在物理服务器之间进行无缝迁移,虚拟化提供革命性的灾难恢复计划。虚拟化技术能把工作负载自动转移到其他资源,提高反映速度,降低成本,在灾难发生时能使业务保持连续,成为信息化管理的重要工具。

数据中心的容灾解决方案是新的增值业务手段,而VMWARE容灾系统涉及两个关键参数RPO和RTO:

(1)RTO,Recover Time Object,恢复时间指标,是指当灾难发生后,生产系统需要多

长时间能够恢复生产,它是衡量企业在灾难发生后多长时间能重新开始运转的指标。

(2)RPO,Recover Point Object,恢复点指标,是指灾难发生后,容灾系统能把数据恢

复到灾难发生前的哪一个时间点的数据,它是衡量企业在灾难发生后会丢失多少生产数据的指标。

据国际标准SHARE 78的定义,灾难恢复解决方案可根据主要问题所达到的程度而分为七级,即从低到高有七种不同层次的灾难恢复解决方案,具体可根据企业数据的重要性以及需要恢复的速度和程度,来设计选择并实现灾难恢复计划。

一个完善的容灾系统主要包括:

三个层次:数据容灾,应用容灾和网络容灾;

两个级别:本地高可用性(HA或者备份),异地容灾。

(3)数据容灾就是指建立一个异地的数据系统,该系统是本地关键应用数据的一个同步或异步复制。

(4)应用容灾是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统(可以是互为备份),在灾难情况下,远程系统迅速接管业务运行。

(5)网络容灾是指在灾难发生后,当应用系统完成正确的迁移后,将访问应用系统的网络流量正确的导向远程的容灾系统。

(6)本地高可用性可通过高可靠性的集中存储,高可靠性的虚拟计算体系为客户提供本地高可用性。

我厂在实施容灾异地备份项目中,采用Vmware与IBM产品的结合为所有虚拟化应用提供了最可靠、最经济高效并且最简单的灾难保护。

2、容灾备份目标

(1)保证我厂关键信息应用系统在最接近的时间内,复制到远端生产楼的备份设备,防止因灾害发生引起重要数据的丢失;

(2)采用IBM DS5020两个阵列在VMWARE应用环境下,实现异地存储备份;

(3)通过关于关键信息应用系统的远程存储备份,实现在信息中心主机不能正常运行情况下,生产楼的远程备份接替关键应用系统的工作。

3、我厂容灾备份方案特点

(1)对物理主机及虚拟机的完整保护:

(1)与VMware ESX Server完全集成;

(2)724小时备份及可用性。

(2)集成VMware ESX Server提供持续可用性:

(1)通过最新的完整备份,从虚拟机恢复系统及服务;

(2)三个简单步骤,10分钟完成物理主机到虚拟机(P2V)转换,可实现在线P2V转换,立即启动备份服务器。

(3)直接升级到远程容灾机制:

(1)直接将完整VMware系统及数据复制到灾备中心,有效利用硬件资源;

(2)利用VMware SRM快速实现站点间的切换;

(3)利用IBMDS5020存储的数据复制技术Enhancement Remote Mirror(简称ERM)技术实现存储级别的硬件级数据传输。

二、容灾备份方案简述

1、IBM DS 5020

本方案采用IBM DS5020磁盘存储系统做在线存储设备,它所具有的高带宽可以满足高吞吐量的业务应用,而且其具有冗余的热插拔组件和丰富的拷贝功能,可扩展性高,能保证在不中断业务的前提下完成数据的完整备份,并能在极短时间内迅速恢复系统。

以下为方案的拓扑图:

方案中,信息中心机房的IBMDS5020通过远程磁盘镜像复制技术ERM,将数据镜像复制到生产楼机房的IBMDS5020,在两套磁盘存储设备间建立磁盘镜像复制关系,

对于主机来讲,活动状态的存储设备只有一台。这台存储设备通过远程磁盘镜像复制技术ERM,保持两个存储设备上的数据一致。存储系统的数据复制对于主机来说是透明的。

本方案基于智能存储设备实现的硬件级别的数据复制,无需占用主机设备的系统资源。本方案还具备其自身的优点,由于它是基于存储设备来实现整个系统的数据复制,因此,它对主机系统的资源没有消耗,可以保证相关主机上的应用高性能运行;另外,基于该种方案的数据复制系统在搭建数据链路时,采用了基于FC的光纤裸链路,不管是采用同步或异步的传输方式,其数据的传输性能可以得到保证。

2、IBM ERM增强的远程复制技术介绍

IBMERM最大的价值:通过实施ERM解决方案,可以在另外一个机房得到一份完整的数据,如果主机房出现问题的话,在另一个机房还有一份完整的数据可以使用,解决了后顾之忧。

DS 5020存储产品使用IBM ERM增强的远程镜像技术来实现数据备份,包括Metro Mirror(同步的镜像模式),和Global Mirror(异步的镜像模式)。

本项目采用Metro Mirror(同步的镜像模式)。

镜像模式是全面的容灾和业务连贯性策略的组成部分。对于重要数据推荐使用Metro Mirror模式,而对不十分重要的数据可以使用Global Mirror的混合方式。

Metro Mirror用来将一个存储系统镜像到另一个已经超过距离范围的系统。它被用来在存储系统内部控制同步,因此对于主机应用服务器来说,它几乎是透明的。这项功能被用来提供数据可用性,并且是实现容灾和业务连贯性的关键技术。Metro Mirror模式可以对逻辑驱动器进行同步镜像。Global Mirror用于异步镜像,并包含写顺序一致性选项。

3、VMwareRv CenterTMSite Recovery Manager

VMware v Sphere为构建灾难恢复解决方案奠定了最佳的基础,降低灾难恢复成本并简化灾难恢复计划。v Sphere提供了以下重要功能来改进灾难恢复:

(1)整合:可以同时在生产和故障切换站点上整合硬件基础架构以降低成本。恢复硬件还可用于运行低优先级的工作负载,包括测试和开发环境。

(2)独立于硬件:虚拟机完全独立于其底层硬件。组织可以在故障切换站点使用较旧或较廉价的硬件以降低成本。

(3)封装:在v Sphere上,整个系统(包括操作系统、应用和数据)封装为一组虚拟机文件。通过将这些文件复制到故障切换站点,只需轻松一步即可快速恢复整个系统,从而将通常情况下的恢复时间从平均40小时缩短为不超过一小时。

VMwareRv CenterTMSite Recovery Manager是一款面向虚拟化环境的市场领先的灾难恢复产品,它可确保为所有虚拟化应用程序提供最简单、最可靠的灾难防护。

4、Site Recovery Manager 5.0架构

(1)Sphere Replication基于网络复制:

将灾难恢复覆盖范围扩大到第2层应用和小型站点

(2)Array Replication基于阵列复制:

适用于大型站点,存储复制,应用于关键应用

(3)Site Recovery Manager与VMwarev Sphere、VMware v Center Server和底层复制产品紧密集成,可以自动执行端到端恢复流程。Site Recovery Manager提供一个简单的界面,可用于设置跨所有基础架构层协调操作的恢复计划,从而取代传统的容易出错的操作手册。Site Recovery Manager利用经济高效的VMware v Sphere?Replication和基于第三方存储的复制功能,提供对恢复计划的集中管理,实现无中断测试、站点恢复自动化和迁移流程自动化。用户可以根据所需频率无中断地测试恢复计划,以确保它们符合业务目标。在进行站点故障切换或迁移时,Site Recovery Manager将自动执行故障切换和故障恢复流程,以确保实现快速、高度可预测的恢复点目标(RPO和恢复时间目标(RTO)。

实现管理集中化和恢复自动化

VMware v Center Site Recovery Manager是v Sphere的补充产品,可确保为所有虚拟化应用提供最简单和最可靠的灾难保护。v Center Site Recovery Manager利用经济高效的v Sphere Replication或基于存储的复制功能来集中管理恢复计划、实现无中断测试,以及实现站点恢复和迁移过程的自动化。

5、Site Recovery Manager的工作原理

Site Recovery Manager与底层复制产品、v Sphere和v CenterServer紧密集成,以自动执行端到端恢复流程。

设置恢复计划后,管理员可以使用测试、灾难恢复故障切换或计划内迁移工作流执行虚拟机完全隔离。

三、结论

IBMDS5020的远程磁盘镜像复制技术ERM和VMware的SRM的完美结合,为我厂关键信息应用系统构筑了安全、可靠、高效的存储备份体系,该体系的优势体现在以下两个方面:

服务器的高可用:使用VMware v Sphere和v Center Site Recovery Manager可确保

高度可靠的RTO和RPO,并且成本和复杂性程度远低于传统灾难恢复方法。借助Site Recovery Manager,可以将灾难防护扩展到在v Sphere平台上运行的所有应用程序。

存储高可用:通过IBMEMR Metro Mirror(同步的镜像模式)远程磁盘镜像复制技术,在两套IBMSystem Storage DS5020磁盘设备间(信息中心机房及生产楼机房各一套),建立磁盘镜像复制关系从而实现存储高可用性,从而建立完善的存储备份中心,保证关键数据的可恢复性与业务应用的可持续性。

参考文献

[1]Laura DuBois.IDC白皮书.同事先备份现代化加速虚拟化进程[R].2010年12月.

浅析容灾备份方案的设计 第9篇

1) 在国内, 当前应用级容灾备份系统的用户还不多。主要原因有:

首先观念是重要因素。容灾备份系统的投入相当大, 而它所针对的只是一些诸如火灾、洪水、地震等小概率事件, 因此, 对许多用户来说, 这种高投入和相对小概率的产出是他们望而却步。然而却不然, 有的时候关键数据的丢失造成的损失远远不能用钱数来衡量的。

其次, 容灾备份系统并不仅仅针对突发性灾害等小概率事件, 其他一些宕机事故, 如人为误操作、机房事故等, 也可使用异地容灾备份系统实现关键业务的持续云装。

最后, 容灾备份系统还可以被用来开展诸如数据挖掘、用户查询等其他业务, 可以很好的降低对主业务运行的影响。

综上所述, 综合考虑业务中断、数据丢失所导致的损失和增值业务所带来的收益, 容灾备份系统的建设和投入还是很值得的。

2) 国外容灾备份的应用情况。容灾备份计划在发达国家电信行业和金融行业得到了较早的实施, 现已较为普遍。例如美国, 因一九八五年纽约银行计算机故障, 联邦管理部门更加了在这方面的监管力度。

现美国计算机业务系统一般处于以下三个方面来考虑容灾备份计划:一是重要数据保护与业务连续运行的需要;二是审计的需要;三是法律的需要。

二、要解决的主要问题

1) 通过容灾备份方案保证数据的安全性和系统的高可靠性, 使存储系统具备高可扩展性, 即高性能、业务服务不停顿、数据不丢失。

2) 集中存储。采用全冗余模块化体系架构设计, 结合存储的高级功能, 满足可靠性以及空间利用率的要求。

3) 全局备份。实现整个业务系统的全网备份, 并对关键数据实现离线保护和快速回复。

4) 数据中心任何计算机系统硬件、软件及应用的单点故障将不会影响整个数据中心的处理工作。数据中心由于灾难等原因无法工作时, 应有一个备份数据中心能够迅速接管关键应用, 继续运行。主数据中心恢复后, 应用系统、业务数据应能迅速切换回主中心运行。

三、应用于容灾备份方案的需求分析

(一) 容灾备份系统的目标

1) 具体数据类型与目标的灾难保护。从业务系统正常运作的角度分析各种业务数据, 做出重要性与可恢复性要求的评估, 并由此制定系统的数据灾难保护。

2) 灾难发生后的可恢复业务分析。对各个业务系统及管理流程进行分析评估, 并由此制定系统的灾难备份策略, 通过智能存储设备进行实施远程数据复制, 实现数据的容灾。

3) 灾难发生后的业务可恢复事件指标。我们通常将灾难的发生分为两种, 一种是可以预计具体时间的灾难, 另一种是不可预计突发性的灾难。针对两种不同灾难, 要设定不同的恢复时间指标, 并根据不同业务系统的个子特点, 确定不同业务系统的灾难恢复时间。

(二) 容灾备份系统的建设原则

确保灾难情况下重要数据的安全存储;

确保灾难发生后系统运行的及时恢复, 包括数据恢复;

将因灾害而导致的利益损失降低到最小程度;

确保系统的可扩性、可维护性、可操作性;

降低业务系统复杂度, 降低故障风险, 降低数据丢失风险;

完整的每日数据备份, 有助于当灾难发生时, 提供最近时间点的数据备份恢复能力;

当生产存储设备出现硬件故障时, 快速切换到另一台存储设备上, 将故障恢复时间降到最小。

(三) 容灾备份系统的需求与规划

针对核心业务, 在主机房构建新的核心业务服务器和存储, 实现双机热备模式, 集中共享存储。在第二机房建设一套容灾核心业务系统, 包括服务器和存储, 实现生产数据实时更新到容灾业务系统中。实现存储的高可用, 任意一台存储出现问题, 也不会影响主要业务的运行。

增加新的服务器和存储, 对现有的核心业务系统都进行数据迁移, 保持新旧服务器和存储数据同步。

构建一个完整的数据统一备份系统, 将整个网络中的所有关键数据库数据进行备份, 建立统一的备份策略, 自动备份数据。这样在主存储设备中的数据出现损坏或丢失的情况下都能迅速从备份系统中得以恢复, 以至于将来可能的数据迁移、数据复制等一系列数据管理操作, 都通过备份系统来统一管理。

有条件的话可以在异地部署一台备份设备, 用来对业务系统的数据进行异地备份, 使数据多一层保护。

四、容灾备份系统的解决

(一) 硬件设备及连接

在主机房采用高性能存储设备作为生产系统数据存放的介质, 在容灾备份机房配置与生产中心机房相同的存储设备作为远程复制的介质, 在灾难或紧急情况下供业务数据的恢复使用。主备中心机房都采用光纤连接, 在主机房部署光纤交换机作为核心交换设备, 并通过远程复制软件来实现主备存储的数据同步。其特点为数据容灾对主机系统透明, 无须占用主机资源, 而且可以在主机上灵活实现数据镜像卷对等生成、拆分、同步和删除操作, 并可与应用脚本集成, 自动运行, 这样就具有了一定的防灾抗灾能力。

(二) 数据的复制方式

通过磁盘阵列实现容灾备份功能, 有两种实现模式:同步工作模式和异步工作模式。

同步工作模式在服务器向存储写数据时, 每一个IO会同时写往远程备份中心的存储阵列, 并且在确认往本地和远程都写成功后才会应答服务器, 表示写操作成功, 在生产中心和备份中心正常运行过程中, 同步机制会保证生产中心和备份中心的存储阵列中的应用数据完保持一致, 当生产中心发生灾难时, 备份中心的数据完全保留了生产中心发生灾难前的数据, 最大程度保护了业务数据的安全。

对于异步模式, 在生产中心, 每一个IO写往本地存储阵列后马上应答主机服务器写成功, 应用继续运行。存储阵列本身在把数据传往远程备份中心。由于异步远程更新的执行, 应用程序不必等待远程更新的完成, 因此对远程数据备份的性能影响较小, 并且备份磁盘和生产磁盘间的距离理论上没有限制。然而, 当应用数据在传输一致时, 生产中心发生灾难了, 这些传输的数据会丢失, 这样就需要花费时间去额外的恢复数据。

(三) 应用级容灾扩展

容灾备份系统是基于数据级容灾进行建设, 存储设备之间的同步数据复制保证了数据的安全性, 但是数据级容灾备份只是保证业务高可用性的第一步, 为了满足应用快速恢复的要求, 还需要构建应用级的容灾。在实施应用级的远程容灾方案后, 当主数据中心因为各种原因无法正常运行时, 原来运行的主数据中心业务系统将切换到备份中心继续运行, 根据事件的预知性和不可预知性, 切换方式相应的也分为两种, 即手工方式和自动方式。

当主数据中心发生软、硬件升级时, 便可采用手工方式切换到备份数据中心。当采用自动切换时, 就需要借助于高性能可用性集群软件, 从而实现应用系统的自动切换功能, 以保证当突发性灾难发生时, 即使在无人值守的情况下, 也能够实现业务系统的正常切换, 确保业务系统能够实现全天候的正常运行。

五、结论

容灾备份主要实现对核心业务系统的重新部署和把非核心业务系统都迁移到虚拟机种, 并对核心业务和非核心业务系统进行数据备份, 实现所有业务系统的高可用和容灾。

除此之外, 一个好的备份恢复系统, 不仅配备好的软硬件, 更需要有良好的备份策略进行保证, 而对于备份系统, 必须根据各种应用业务的处理类型来分别制定具体的备份策略, 这样才能更好的保证数据的安全。

最后, 容灾备份其实就是人为的建立两个数据中心:主数据中心和备份数据中心, 主备数据中心通过通信线路, 实时的将主数据中心更新数据拷贝到备份数据中心存储系统中, 保证主备数据中心数据的实时一致性, 并确保数据最大完整性。

参考文献

[1]王改性, 师鸣若著.数据存储备份与灾难恢复[M].北京:电子工业出版社出版, 2009.

[2]王淑江著.网络存储·数据备份与还原[M].北京:电子工业出版社出版, 2010.

[3]康春荣, 苏武荣主编.数据安全项目案例:存储与备份SAN与NAS容错与容灾[M].北京:科学出版社, 2004.

容灾备份技术范文

容灾备份技术范文(精选9篇)容灾备份技术 第1篇目前, 需要多种数据复制技术, 对容灾系统进行建设。对业务系统的需求和多种应用进行满足...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部