• 7.31 MB
  • 2022-04-22 11:32:59 发布

数据中心存储集中及容灾方案1.1

  • 71页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'数据中心存储集中及容灾方案前言感谢XX领导和专家对易安信公司的信任和支持,给我们一个机会参与数据中心存储集中及容灾项目,我公司将全力以赴,为XXIT系统的建设作出贡献。作为信息基础架构的提供商,我公司拥有完善的技术团队和丰富的行业应用经验。在本方案中,我公司提出了一套高可靠性的解决方案,充分利用了存储技术的最新发展成果,考虑了系统的先进性、高可靠性、高可用性、系统的灵活扩展能力、开放性以及高可管理性等原则,并对项目的具体需求提出了解决方案。EMC相信,通过与XX的密切合作,能够建设一个高标准的IT系统,并为将来长期的友好合作关系打下良好的基础。我公司凭借先进的技术和出色的支持服务以及多年来在各行业的成功经验,相信通过双方的合作,能够使系统项目顺利实施,从而为XX提供一个健康、安全、高可用的业务运行环境,并进一步建立长期的友好合作关系. 第一章项目背景描述XX信息化建设方面,系统建设已比较全面,业务部门的信息化程度已比较成熟,拥有包括ERP系统、邮件,OA,设计等多个系统。众多内容丰富、功能强大的应用软件逐渐成熟,成为XX信息技术的核心。XX作为国内大型的研究,制造军工单位,信息系统是一个数据量大,数据类型复杂和事务并发多的系统,随着时间的推移,这些环境的数据越来越多,数据的价值也越来越大。如何管理及保护好这些数据,是本次项目主要解决的问题。具体来说,项目一期实现的目标是:·存储整合:目前系统数据存储扩展能力有限,数据在多个应用之间,如何高速、快捷地传递及统一的数据管理,存储成为一大瓶颈。针对这个问题,本次方案将实现主要系统的存储整合。·备份整合:随着应用系统业务越来越多,数据量不断增加,数据价值的增大,不能因为数据的丢失与损毁造成业务的中断。实现信息系统数据异地备份及统一备份也刻不容缓,本次方案将实现数据中心信息系统数据统一备份,并实现数据异地备份。·异地容灾:随着XX业务飞速发展,对业务系统依赖性越来越强,不允许业务系统有任何中断,为了保证信息系统的稳定性,在本次方案中实现主机房信息系统同三十多公里外数据中心应用级异地容灾。71 第一章解决方案的设计1.1方案设计的原则源自技术先进性、可扩充性、高可靠性、高可用性、成熟性、可管理性的设计原则和总体设计思想,依靠业界优秀技术设计理念和产品,借鉴了包括在内的全球众多成功案例和实际经验,我们设计了存储整体的系统方案。技术先进性:系统设计采用当前先进而成熟的技术,不仅可以满足本期工程的需求,也掌控未来的发展方向。从技术角度出发着眼未来,确保用户获得技术成熟并且先进的产品方案。可扩充性:在系统设计时充分考虑可扩充性,从而确保新功能、新业务的增加在原有的系统平台上扩展和实现。确保存储设备对主机系统的广泛支撑能力。高可靠性:存储设备平台具有高可靠性,具备先进的冗余的设计。充分保证系统7x24小时不间断稳定运行和高容错能力,具有灵活的存储系统容量和性能调节能力,同时提供极为充分的可靠性各项指标设计。高可用性:在线磁盘系统不停机情况下,实现不停机扩容、维护、升级等服务,提高性能以满足新的业务需求。可管理性:提供功能强大的管理软件对存储系统进行有效的管理。可实施性:选用成熟的技术,成熟的案例经验和设计方案,制定详细的技术实施方案。1.2存储整合的阶段规划依据统筹规划、分步实施的指导原则,作为最重要的IT基础的存储平台,不仅仅是在项目设计与建设实施阶段,还应该覆盖在系统运行、维护、升级扩展等整个生命阶段。一个好的IT架构,必定是一个层次清晰,模块严谨的结构。首先,作为IT基础设施中最重要的存储平台,本方案具有良好的模块化特性,它71 应该具有十分出色的连接和支持能力。方案提供的存储基础平台具有丰富的功能特点,不但能够满足项目建设的各阶段要求,还为未来的发展打下良好的基础。信息系统架构将越来越多地把更多的数据和应用整合在一个统一的平台上,同时基于此架构实现多应用的业务连续性要求。方案正符合这样的趋势:采用存储网络技术,使得整个存储基础设施具有很好的扩展能力,随着业务的发展,可以通过扩展网络支持更多的服务器、通过扩展存储可以提供更多的存储空间以及I/O处理能力。要支持大规模信息的集中访问,存储基础平台还必须具有足够的处理能力;在IT系统当中,I/O性能往往会成为整个系统的性能瓶颈;因而,需要采用领先技术使得存储系统能够完全消除这种瓶颈,支持大规模的数据集中访问。网络数据中心建立集中的系统体系架构及管理,是当今技术发展趋势,也是一个中长期项目,都要采用综合考虑全面兼顾的方法,然后稳扎稳打分步建设,最终形成一个先进性的强大系统体系。针对信息中心的现有业务特点,并且配合客户的发展规划,我们建议总体方案将分为四个建设阶段:项目一期:第一阶段数据整合平台建设第二阶段数据保护系统整合建设第三阶段业务连续性系统建设项目二期:第四阶段服务器虚拟化平台建设第一阶段做好数据整合平台建设是数据信息中心统筹建设的最基本一步,也是整个系统架构的重要建设环节。信息技术的核心是信息,围绕着信息的处理,信息的传送,信息的管理,信息的共享,信息的保护等等,人类在信息技术的各个方面不断取得突破。人们越来越清楚地看到信息的载体—存储系统在整个IT环境中成为基础架构,它是保证IT环境的其它部分(主机,网络,应用等)正71 常运转的关键。客观地讲,离开了整合存储系统的IT环境将成为无米之炊,什么也做不了。第二阶段数据保护系统建设是针对第一阶段的数据大集中完成后实施的,可以理解为对系统和数据的备份保护平台整合。当客户完成第一阶段的建设后,形成了一个统一数据存储平台,而后随着业务的发展,各项业务的运行会越来越依赖于计算机系统的电子数据。数据量也会逐年翻番,网络系统的复杂度和数据的规模增加了数据管理的难度,正在广泛使用的存储结构也对备份系统也提出了更高的要求。这时候就需要我们建议一个更完善的数据保护系统,来满足实际需要。这样做,是要实现数据的副本保存,当设备损坏和数据丢失时,通过我们建设的一个包括策略、程序、制度和相关技术结合的数据保护计划,能快速恢复系统和原有关键数据。另外,在做备份系统的选择时,要关注备份系统的成熟性,是否适合大型的,分布式数据中心的复杂多变的环境下的数据保护,还要有优异的性能,同时要支持跨操作系统平台、跨机构的数据恢复,以及要靠考虑安全性、易用性、易维护性和可管理性等因素。第三阶段的业务连续性系统建设,也就是建立关键业务和核心平台的容灾系统。容灾方案的技术核心是实现远程数据复制,并能够在灾难发生时在远端利用复制数据提供企业业务运营支撑服务。其中,采用基于存储的虚拟化技术建设容灾系统是目前客户采用较多的双活容灾方案,有越来越多的应用案例。采用基于存储虚拟化的容灾方案的技术核心是利用盘阵对盘阵的数据块镜像技术实现对生产数据的远程拷贝,从而实现生产数据的灾难保护。在主数据中心发生灾难时,可以利用灾备中心完全同步的数据在灾备中心建立运营支撑环境,为业务继续运营提供IT支持。同时,也可以利用灾备中心的数据恢复主数据中心的业务系统,从而能够让企业的业务运营快速回复到灾难发生前的正常运营状态。EMC公司的基于存储虚拟化的容灾方案已经得到了广大用户的实际应用检验,方案的可行性、产品的成熟度、稳定性、可靠性、灵活性都的到了大量实际应用的考验。EMC的技术服务队伍已经在众多容灾项目成功实施过程中表现出强大的技术力量,能够确保用户容灾方案的成功实施。71 第四阶段服务器虚拟化平台建设,采用服务器虚拟化技术架构,逐步整合现有服务器环境。通过方案的测试与验证阶段后,将其中的单机业务引用逐渐从现有部署环境迁移至虚拟化平台,再通过虚拟化平台实现的业务连续性方案保证措施,逐步实现一类业务应用的虚拟化平台迁移与部署,最终建成虚拟化计算环境资源池。该解决方案将极大的提供服务器整合的效率,大幅度简化了独立服务器及本机应用管理的复杂性,提高了整体系统的可用性,同时还明显的减少了投资成本,具有很好的技术领先性和性价比,虚拟技术由于采用了将传统服务器应用程序环境封装成可移动的档案文件的技术,很容易实现业务的连续不间断运行,针对应用和访问量灵活部署,降低系统总成本。总而言之,在统一规划、建设好数据整合平台的基础上,才能在以后一步步有效的进行数据保护系统整合建设和业务连续性系统建设。本方案下面主要帮助XX信息中心对第一、二、三阶段的建设的作出合理化平台选型和存储技术建议。第一章项目一期存储整合技术方案1.1方案设计的思路和架构按照XX的应用需求,我们将按照以下的思路进行集中存储系统构建:1配备高性能,高稳定性的存储产品;2建立完整的存储解决方案,实现足以支撑当前以及未来存储空间需求的大容量在线存储系统。3实现数据的在线高可用性,避免由于逻辑故障、人为因素、意外事件导致的计划外停机。4配置企业级磁盘存储产品,将用户系统中的数据集中存储至核心存储中,实现数据高速共享。建立完整的高安全性、高稳定性、高性能的数据集中存储系统环境。5响应绿色IT,节能减排的国家号召,采用低功耗的设备。71 1通过全球知名的品牌产品与全面的服务网络提供优质解决方案,以及最佳的产品组合和兼容性。本方案是针对用户实际的业务系统状况及依据EMC的经验专门设计出的整体解决方案。1.1数据集中方案建议结合XX集中存储需支撑的应用系统及未来三年存储空间业务需求,主机房集中存储方案需实现的目标:1,稳定可靠安全2,强大的I/O处理能力3,存储需要在未来支持多个应用的数据,存储空间预估当前需要500TB的存储空间,未来必须保证有足够的扩展能力。4,统一的管理5,24X7不间断运行的能力6,智能化存储功能7,投资保护,数据迁移方便71 集中存储的业务模式对于存储的性能有更高的要求,其性能的高低对于数据库的运行起到决定性的影响。信息中心的建设不但是网络系统,主机系统,数据库,存储系统等简单的堆积和链接.要对业务类型进行分析和归类,从而进行业务系统的优化和存储系统的优化,达到最为合理的系统配比。每台数据库服务器和前端应用服务器应至少配置两块以上的HBA卡(三块更为合理,两块用于存储,一块用于备份),满足冗余和业务连续性的需要。在磁盘阵列方面,本方案推荐了EMC中高端的智能存储系列产品VNX7500来存放核心业务数据。VNX7500具有软件功能技术领先,硬件性能领先,可扩展性强的特点。EMC中高端存储设备现在前端端口全部为8Gb/s的产品,支持虚拟资源调配,FASTCache,FAST技术,业务优先级动态处理等诸多业内属于领先水平的存储技术.连续十五年居于世界第一位.得到了各个行业客户的充分认可。同时为了更好的为主机与存储系统提供最优的链接服务,本方案推荐使用SAN8Gb/sFCP交换机,可扩展到80端口的DS5300B。1.1.1SAN交换机网络设计FCSAN存储网络由2台EMCDS-5300B,激活48端口SAN交换机构成高性能的冗71 余存储区域网,链路故障时可自动切换,无单点故障。每台提供64个8Gb/s的FC端口,2台总共提供96个8Gb/s的FC端口。可以满足服务器的连接需求,其余端口用于连接8个FC端口的生产存储系统和虚拟带库的连接,并为未来的存储扩展和备份系统准备。1.1.1存储磁盘阵列设计存储磁盘阵列采用1套EMCVNX7500高性能企业级存储系统构成。其磁盘总容量500TB,其中200TB为15krpm600GBSAS磁盘,300TB为7.2krpm2TBNLSAS磁盘,共提供16个8Gb/s前端磁盘端口,并且可以根据用户的需求在线进行扩展到32个。为了满足磁盘阵列的I/O性能需求,1套企业级FC存储系统配置了2个存储控制器负责FCSAN数据传输,提供8个6Gb/s后端端口(共32个通道)。存储系统CACHE配置为48GB,CACHE可以根据应用需求灵活扩展到2000GB(通过FASTCACHE方式)。第二章项目一期数据迁移方案2.1数据迁移的目的目前,XX应用系统在存储系统中存放的数据,本次项目中需要将原有数据平稳、安全的迁移到新增的VNX7500存储系统中。新增的存储系统无论扩展能力、处理性能相比原有存储系统都将有大幅度提升,为此,我们计划将现有存储系统上的数据依次迁移到新增存储系统中,以满足未来业务扩展的需要。71 1.1数据迁移的原则确保数据安全性在技术允许的条件下,要绝对保证数据的安全性,要绝对避免数据损失、丢失等风险。确保数据一致性由于XX应用系统目前运行的大多数应用系统都是基于数据库系统开发的,所以在数据迁移的过程中要保证数据一致性,一定要避免数据迁移后系统无法正常启动等风险的出现。确保现有主机正常工作在数据迁移过程中,要尽量避免给主机带来不必要的风险,造成业务系统非计划宕机。确保停机时间最短在数据迁移过程中,业务系统停机是不可避免的,但是应该尽量缩短停机时间。分步骤实施由于XX应用系统主机数量较多,所以数据迁移必须分阶段实施,数据迁移方案也应该给出不同阶段的工作量。由专业人员进行数据迁移由于XX应用系统设备众多,数据迁移时牵扯到主机、光纤交换机和存储系统等不同厂家,为了确保数据迁移的安全、可靠并最终成功,所有数据迁移所涉及的到设备厂商必须由原厂商工程师实际操作。1.2数据迁移过程为了保证所有迁移能够有条不紊地进行,并且保证业务系统的平稳过渡,我们把整个迁移分为5个阶段进行。71 l第一阶段:迁移评估l第二阶段:迁移规划和设计l第三阶段:变更控制l第四阶段:数据迁移实施l第五阶段:数据迁移后审查第一阶段:迁移评估数据迁移项目的第一阶段首先需要定义数据迁移的范围和确定客户的详细需求,并且对客户当前的环境进行初步的分析,以确定数据迁移的可行性和对当前环境的支持程度。在这个阶段,还需要根据客户的业务需求选择适当的迁移方法。在数据迁移项目中,客户的每套业务系统对于EMC来讲都是至关重要的,需要努力花时间做好迁移评估阶段的工作。做完数据迁移项目第一阶段的工作后,客户将能得到如下结果:l安全、平稳、风险最小的数据迁移解决方案l可重复和可预见的迁移结果l满足客户业务影响需求的数据迁移的具体要求l与客户一起建立有效实施、管理数据迁移项目的团队成员EMC在数据迁移方面有许多数据迁移技术和方法,其中大部分是基于阵列或主机为基础的。客户的业务需求决定了最适当的方法来部署具体的迁移项目。要确定合适的方法,重要的是要进行初步分析,因此在迁移评估的阶段需要收集当前环境的以下信息:l需要迁移的数据量收集客户环境中有关的具体的数据量和LUN的大小l客户应用系统的可用性根据需要数据迁移的应用系统数量和应用系统可以宕机的时间窗口往往能够确定使用适当的数据迁移方法。在线的数据迁移会带来额外的风险,因此客户需要对应用系统的可用性的影响进行权衡。l容量分配的要求71 数据迁移往往会提供一个重新构建LUN大小和存储分配保障计划的机会,因此需要在评估阶段考虑未来容量规划的问题。l性能的影响数据迁移通常涉及大量数据移动从而影响到主机、阵列、网络性能和SAN结构,这种影响必须予以考虑。在数据迁移过程中实施数据流量控制的功能,将减少相应的影响。l数据迁移的时间窗口根据客户业务系统的重要级别,可用于数据迁移的维护时间和宕机时间窗口有所不同,某些关键业务可申请的维护时间窗口可能很小。对于不同要求的业务系统选择不同的数据迁移技术是非常必要的,并且对不同的业务系统需要计划好相应的停机时间和业务切割时间。l回退计划为了降低应用系统的风险,在数据迁移实施前必须有一套详细的、可执行的回退操作计划。本项目中,回退计划可以采用两种技术来保证:n本地备份系统XX应用系统原有其他厂商上,在数据迁移之前可以先对数据进行一次全备份,确保数据的安全性,一旦数据迁移过程中出现问题,可以及时使用备份系统来进行数据恢复。第二阶段:迁移规划和设计在数据迁移项目的这个阶段,需要根据对在分析中确定的要求作出详细的设计和实施时间表。为了完成这一阶段的规划和设计需要具备良好的操作变更管理流程。这一阶段包括制定一个数据迁移实施计划,不仅包括该项目的具体细节,也应该包括分析应用系统未来可能增长的需求。数据迁移解决方案的规划和设计必须包含以确保能够达到满足客户业务迁移的需求的迁移方法和环境评估结果。在此阶段,应该至少记录一下信息:71 l具体的源和目标卷l前端端口的连接l设备映射要求l光纤连接l光纤交换机Zoningl物理连线要求l软件版本和许可l缓存要求为了设计未来的增长需求计划,重要的是要考虑存储利用率的趋势和未来可能会影响容量的任何举措,并且分析性能和数据保护的要求,确保最佳的数据布局分布和目标阵列的物理配置。从宏观的角度考虑数据迁移的复杂性,包括服务器负载、网络带宽和容量、源和目标存储系统的性能、SAN流量和迁移时对业务系统的影响、业务的宕机时间窗口,以及在特定的时间数据迁移时数据从一个平台复制到另一个平台时可能出现的影响。妥善的解决方案的设计允许迁移时的流量控制,在计划好的时间里完成期望复制的适当大小的数据,这是保证数据迁移成功的至关重要因素。数据迁移成功的标准是指在规划阶段良好的设计达到客户的业务要求,并且在实施阶段能够完全按照计划进行并得到验证。验证的标准分为两类:数据完整性和性能。显然,数据的完整性在何数据迁移项目是至关重要的,为了验证数据完整性,必须首先定义一个测试计划。这个测试计划可能很简单,比如MD5校验或者能够成功地启动应用系统,但是,用更全面的测试来验证应用系统之间的相互关联的数据集的一致性更有必要。此外,在规划阶段还应该设定数据迁移后的性能标准,并且在数据迁移后也应当达到要求并得到验证。采用收集操作系统的iostat和vmstat数据来验证相关的性能指标,至少收集一天的数据来比较数据迁移前后的性能差异。如果采用的数据迁移技术是一种新的技术,应该在部署到生产环境之前,现在非生产的测试环境中得到验证。这样能够最大限度的减小风险,以达到客户对业务系统数据迁移的要求。71 当数据迁移项目中采用较新的技术或者需要升级版本,额外必须注意以下几个方面:l支持修订级别和互操作性方面的问题:n主机总线适配器(HBA)nFabricn存储子系统l主机操作系统版本l应用软件的版本级别EMC将在这个阶段通过数据收集并且查询验证EMCSupportMatrix,查明并解决之前的数据迁移中上述所有问题,作为数据迁移实施的一部分,减少现有环境数据迁移的复杂性,以降低数据迁移的风险。第三阶段:变更控制数据迁移项目必须符合变更管理流程。以下是变更管理涉及的内容:l风险评估变更管理的一个重要组成部分是一个完整的风险评估。风险评估是从一个失败的变更分析出可以出现什么问题,如何预防,以及如何减轻影响的变化。这种分析应该包括一个文件记录和回退测试计划。l迁移计划这是一个在规划和设计阶段建立的审查实施迁移的计划。这个计划中包括了当前和目标环境,以及逐步的操作过程。l先决条件和依赖对数据迁移实施方案的执行过程中所有OnSite的支持,以及相关的参与人员,供应商、零部件供应等先决条件,应记录和计划。l时间线和时间表如果目前的行动是至关重要的,时间安排和时间表必须要明确,以满足有限的业务系统维修或割接时限要求,并且确保备份计划进行准备。l资源计划71 该计划应包括相关人员的可用性,技能和责任。第四阶段:数据迁移实施在这个阶段,按照设计阶段制定的计划实施。一般数据迁移执行的最佳做法包括:l作为第一步,执行涉及的所有数据的完全备份。l审查的详细实施步骤。采用脚本的方法是首选的方法。l确保实施计划中定义的业务系统重要级别和业务停机时间窗口以及回退计划是正确的,并且实施人员能够完全理解并执行。l进行试点迁移或实施尽可能高级的测试。预先计划一个迁移测试是非常有价值的。l在迁移项目前期观察数据吞吐量。如果在迁移实施前期发现迁移的时间段内某些吞吐量估计和实际吞吐量存在显着性差异,可能还有时间调整时间表、减少性能影响或采用其它应急的数据迁移方法,以避免在项目中超过计划的时间表。l一切操作都严格按照测试计划和相关文档。在生产数据的在线迁移过程中的最高风险无疑是不可控的数据完整性问题,如果这些因素都被列入计划并记录和明确之后,这种风险通常可以缓解。关键是要按照与客户协商好的计划按部就班的逐一应用系统实施、验证并得到客户业务的验证。l问题及时上报以及专业人员实施。在迁移过程中碰到问题及时寻求二线专家的帮助是解决问题的更容易和快速的途径。在进行数据迁移时确保专业的技术专家严格按照文档实施并且保证相关的支持系统畅通,是减少风险的重要因素。如果实施人员行为不当,参与支持系统在有帮助需要时得不到支持,甚至实施人员没有什么经验,将会给数据迁移带来非常大的风险。第五阶段:数据迁移后审查在这个阶段,确认没有技术人员、服务质量以及数据完整性的影响。执行以下工作:71 l采集数据迁移后的性能数据并与计划中的定义去比较,验证是否达到客户的期望值l执行迁移过程中使用的迁移工具等项目的清理。l利旧或者清理数据迁移前原始的SAN系统和磁盘系统。l审查在迁移过程中发生问题的处理方式和结果。l提供迁移后数据环境最终状态的文档。例如包括地址、容量大小、存取速度、以及发生变化的数据源和可能影响业务的数据源的名字。l更新SANSwitchZoning和其他文件。1.1数据迁移方法在数据迁移过程中通常有两种途径来移动物理数据:l基于主机l基于阵列在选择适当的办法之前,重要的是先了解进行数据迁移的范围。选择数据迁移方法的过程应包括评估现有的数据迁移策略、相关的限制和制约。针对XX应用系统本数据迁移的项目,推荐重点关注基于主机和阵列为基础的数据迁移方法。基于主机的数据迁移XX应用系统可用主机的复制作为进行数据迁移的方法。主流的开放操作系统都包含本地工具,用于实现基于主机的数据迁移。Windows/UNIX环境中可采用本地逻辑磁盘管理器(LogicalDiskManager/LVM)的功能。基于主机的数据迁移,通常是由服务器管理员,而不是存储管理员,因为它需要服务器的根(root)/管理员级别的访问。基于阵列的数据迁移基于磁盘的数据迁移利用存储系统资源进行物理数据的移动。这种方式的好处是可以保留主机的资源,特别是在线迁移数据的时候。当然,基于磁盘的迁移将消耗磁盘存储系统内部的资源。此外,基于磁盘的迁移可能需要专业人员的技能和知识,特别是跨异构存储环境。71 第一章VNX存储功能和特性EMC存储系统可靠性EMC存储产品业界最高的可靠性设计(由第三方评测可靠性99.999%)EMC存储产品采用点对点的硬件设计、独有的软件功能和配置最佳做法结合在一起,在所有存储平台中已经具有最高的可靠性和可用性—经评估,在客户的应用程序环境中都已达到了“五个9”(99.999%)的可用性。故障检测和隔离功能UltraPoint技术将FLARE软件功能与点对点设计结合在一起,提供更精细的端到端故障检测和隔离操作。存储系统对等故障记录可以让一个SP收集另一个SP上的故障情况,并自报警,从而加快问题确定和解决的速度。电源中断和硬件故障保护在断电保护上,EMC采用的是业界最先进的CacheDestage技术,存储系统内部采用UPS保护,当断电后,UPS能保持将CACHE内的数据写入磁盘内。而其他厂家则采用电池保护,当断电后,容易发生内存钉死问题,进而造成数据丢实;如72小时后电源不恢复,数据将丢失,存在数据丢失的安全隐患。主动预防性热备盘EMC可以做到将服务发生在故障出现以前,即根据故障发生前的系统报警(如磁盘只坏几个磁道时,磁盘本身仍然是可用的但该磁盘坏的概率很大,这时系统就会报警),EMC将快要坏的部件在故障发生前更换掉。使系统一直处于最安全的状态。EMC的服务是为用户着想的主动服务模式。其它存储系统虽然也有自动报警功能,但由于没有自我诊断、自我纠错和自我故障隔离等功能,此报警属于故障报警,即在故障发生后再报警,然后再进行服务。71 EMC企业级硬盘特有的高可靠性技术Ø扇区级的保护:EMC产品会被格式化成每扇区520字节:512字节存用户数据另外8个字节存储确认信息.每个确认信息位置包括了一个时钟标记,一个写标记,一个shed标记用于当控制器出现故障时能够保证校验信息一致性.Ø时钟标记和写标记:每当EMC存储处理器打开一个新的磁盘组时,存储处理器将检查每个条带的时钟标记和写标记.如果发现不匹配,它将重新计算校验信息.ØShed标记:parityshedding一般是直接应用在出现故障的磁盘驱动器上的.它使用奇偶校验运算来在出现故障的磁盘驱动器上进行数据的重建并使用重建的数据覆盖原来的数据.Ø校验和技术:520位的扇区的正确位置包括了一个整个数据扇区的校验和.当数据被从磁盘中读出后,控制器计算出来一个新的校验和并与从数据扇区读出来的校验和进行比较.如果控制器发现了一个问题,它就拒绝这个数据并再次从磁盘中去读数据.校验和校验存储的数据是不是被重建的数据。Ø数据纠错回写:数据纠错回写,一个提前的数据保护功能.一般被使用在更加高端的存储系统中,所有的EMC产品只要通过一个称为SNiiFFER的固件特性都可以实现.这个SNiiFFER程序持续不断的读数据块检测这个读错误通过磁盘驱动器报告出来.这些错误可能是磁盘恢复错误也也可能是介质错误.SNiiFFER通过在数据没有出现问题之间将数据重新部署到新的区域来响应磁盘恢复错误.如果SNiiFFER遇到了一个介质错误,它将通过使用从失效的阵列组中的冗余信息来重建数据。EMC存储系统可扩展性EMC存储系统采用灵活的存储体系结构,VNX存储系统拥有UltraFlex技术,提供专门构建用于双协议(FC和iSCSI)环境的高性能和高可用性,同时成为了客户可充分利用未来IO技术的基础体系结构。71 在每个存储系统上都内置了iSCSI和FC连接,从而让客户获得灵活性。该灵活性体现在客户可以利用他们带iSCSI连接和光纤通道连接的现有LAN基础架构,针对极高吞吐量要求获得最大性能。VNX可以根据用户应用性能的需求,灵活配置cache容量大小,VNX5700可以根据需求,配置36GBcache到1.5TBcache(通过FASTcache技术)。VNX5700存储系统,最大可以支持到500块硬盘,用户可以在不停机的情况下,将硬盘容量扩展到1.5PB。EMC存储系统可管理性EMC在提供简单易用的工具以实施和管理阵列方面进行了大量投资。易于使用的功能可满足一系列要求,从而简化了日常管理、安装、维护和升级。在虚拟资源调配中,存储系统已经将容量规划和资源调配活动的最佳做法编码化,以便进一步简化信息存储专家的日常操作。71 Unisphere管理套件可以在单一界面管理多套存储系统(在本系统中可以通过Unisphere单一管理界面统一管理多套存储系统),提供了简单的基于Web的发现、监控、报告、配置和调整功能。另外,所有附加功能(包括虚拟资源调配、MirrorView、SnapView、NavisphereAnalyzer和NavisphereQualityofServiceManager)都使用同一界面进行EMC的虚拟资源调配方法允许通过虚拟资源调配创建的传统LUN和精简LUN由同一软件应用程序进行管理,实现数据保护和数据迁移EMC存储系统对复杂应用优化控制NavisphereQoSManager(NQM)是一个通过在EMC阵列中相应地分配系统资源来优化应用程序性能的工具。NQM使客户能够确定哪个应用程序应该获取更多的可用系统资源,以满足各个应用程序的服务级别。NQM是一个基于阵列的工具,它在存储处理器内工作,对发送到系统的I/O请求进行测量、计算和控制。它可以监控、限制或设置在EMC阵列上运行的应用程序的性能目标。NQM使用内置监控和存档工具来提供阵列本身上应用程序性能的逻辑视图。NQM设计拥有集成的计划器,以便随时可以达到系统中最关键应用程序的服务级别。它可用于获71 得对您而言最重要应用程序的特定性能目标,或用于监控阵列上的应用程序性能以确定可能的瓶颈。最终可以提供存储阵列性能的清晰视图,避免将时间和金钱浪费在可能发生但不存在的存储问题上。EMC存储系统先进技术功能全自动存储分层技术VNX拥有最先进的全自动存储分层技术(FAST技术)。FAST这一首字母缩写词表示全自动存储分层,此功能可以根据不断变化的需求在各种存储资源间自动移动和放置数据。例如:FAST技术可以与NavisphereAnalyzer配合使用,以便向用户提供其光纤通道驱动器环境的分析,针对不同的数据,将其移动闪存驱动器以改进性能或移到高性能SATA驱动器以降低存储成本。FASTVP(针对虚拟池的全自动存储分层)会以1GB为增量,将数据从高性能层分到高容量驱动器层中,这样整体成本较低,而且不用考虑应用程序类型或数据过期问题。而最令人称道的是,这一切都是基于客户定义的策略自动发生的,通过智能地执行与任务资源调配前后关联的工作,大大节省了应用程序和存储管理员的时间与费用。71 EMC存储系统先进技术功能FAST缓存技术EMC存储系统对于性能要求很高的应用可以,采用配置FAST缓存的技术提供高性能计算对于I/O性能的要求。FAST缓存通过使用闪存驱动器,可使控制器缓存增加64倍,通过缓存的数据命中率提高了4.5倍,大大增加了应用服务器对存储系统访问性能的需求,从而解决存储系统自身缓存不足的问题。FAST缓存具有持久性,即使在电源故障时也能使数据保持缓存状态,不会造成数据丢失。EMC存储系统数据压缩与重复数据删除功能VNX系列包含内置的功能,有助于确保冗余、非活动或预期数据不占用宝贵的存储资源。数据块压缩功能(旨在处理相对不活动的LUN,例如备份副本和静态数据存储库)会自动压缩数据,使客户可以重新捕获容量,并将数据的占用空间减少高达50%。这些功能是作为后台任务EMC存储系统多路径负载均衡软件受功能上的限制,一般的主机操作系统软件并不能自动发现硬件I/O链路的冗余配置情况,通常会把经过不同I/O链路访问到的同一块物理存储空间配置为两个分离的逻辑存储单元。所以,单靠硬件链路的冗余配置,不能实现失效链路的自动切换,而且会提高数据存储空间管理的复杂性,增加因误操作损失数据的可能。因此,方案为接入SAN中的所有业务系统服务器均配置了专门的通道切换和动态负载均衡的管理软件,以实现以下功能:-自动识别冗余的链路配置;监视每个通道的状态,屏蔽错误或不稳定的链路,自动切换系统数据I/O路径;-屏蔽底层的复杂性,为经不同I/O通道访问的一块物理存储空间分配统一的逻辑存储单元符,简化系统管理的复杂性;-通过管理软件还能够在所有的通道上实现动态I/O负载均衡,可以使系统在更短的时间内完成更多工作,全面提高主机的运行效率。71 从而充分发挥链路冗余配置的优势,提高各服务器应用的可靠性和整体业务系统的连续性水平。EMC存储系统对云计算及虚拟化的支持技术VNX系列是适合云计算及虚拟化应用程序环境的理想中端系统。无论客户环境是基于VMware、MicrosoftHyper-V还是基于Xen,VNX都可通过所有支持协议的完全认证,确保在实施的所有阶段都能够成功地部署虚拟化基础架构。这样存储和服务器管理员就不会再盲目地执行操作。通过VAAI(用于阵列集成的vStorageAPIs)将Unisphere与VMwarevCenter™紧密集成,管理员可洞悉整个环境的情况(端到端)。每个人都可以使用其熟悉的管理界面查看虚拟资源和物理资源,透明地对存储进行资源调配、集成复制、访问所有存储功能并将其卸载到阵列上。·只要单击两下,便可通过VMwarevCenter对存储进行资源调配。·针对VMware的EMCVNX插件利用最佳做法可确保存储与VMware之间获得最佳利用率和恢复能力。·可加速硬件的Fast克隆能够在数秒内快速对新虚拟机进行资源调配。·针对NFS数据存储区的按需VMDK压缩功能可将存储消耗量减少高达50%。·与VMware联合开发的EMCProven™解决方案和参考体系结构可加快关键应用程序虚拟化的速度。71 EMC存储系统实现的数据保护VNX系列提供信息保护软件。例如,复制功能有point-in-time的即时恢复功能,快照,克隆和自动恢复来保护,以及可以配置recoverpoint连续数据保护功能。保护数据的逻辑和物理故障发生。第一章采用EMCVNX存储产品的优势1、EMC存储产品成熟度最高,产品稳定可靠EMC的存储系列是全球第一个光纤产品家族,并且在全球第一个实现镜像写Cache技术;全球的装机量超过40万套;EMCCX4-120,CX4-240,CX4-480和CX4-960是EMC第9代全光纤产品,EMCVNXe和VNX5100,VNX5300,VNX5500,71 VNX5700,VNX7500为EMC最新的光纤接SAS存储产品,具有高性能、成熟、稳定的特点。而且据IDC报告,EMC公司连续10年外部存储市场排名第一。2、EMC存储产品市场占有率最高产品广泛使用全球最知名的IT市场调研机构IDC报告称,EMC在高端存储市场一直保持领先地位,最新的数据显示2011年EMC存储市场占有率超过为30%,领先排在第二位的IBM高出12个百分点。3、VNX存储产品业界最先进的的体系结构和扩展性EMCVNX系列存储产品支持多协议文件、数据块和对象存储的统一存储。整合了原有的数据块存储、文件服务器和直连应用程序存储,使组织可以动态增加、共享和经济高效地管理多协议文件系统以及多协议数据块存储访问。VNX操作环境支持MicrosoftWindows26和Linux/UNIX客户端在多协议(NFS和CIFS)环境中共享文件。同时,它还支持高带宽和对延迟敏感的数据块应用程序的iSCSI、光纤通道和FCoE访问。EMCAtmos™VirtualEdition软件和VNX存储结合使用,可支持基于对象的存储,并使客户能够通过EMCUnisphere管理Web应用程序。EMCVNX存储系统利用智能软件和热插拔模块将存储处理器的处理器部分与IO连接分隔开来。此技术允许在线添加和扩展IO连接以增加端口数,或者添加多种连接技术(如10Gb/siSCSI和8Gb/s光纤通道)。提供了高级软件工具和向导,这使得检测、管理和监控模块连接更加方便。71 4、VNX存储产品用于业界最高的可靠性设计EMC存储产品业界最高的可靠性设计(由第三方评测可靠性99.999%)EMC存储产品采用点对点的硬件设计、独有的软件功能和配置最佳做法结合在一起,在所有存储平台中已经具有最高的可靠性和可用性—经评估,在客户的应用程序环境中都已达到了“五个9”(99.999%)的可用性。5、VNX存储高性能与高效的数据服务功能EMCVNX存储产品采用新的IntelXeon多核处理器,提高了控制器的内存量,并且可以通过EMCFASTCACHE技术将闪存驱动器作为可扩展缓存使用,提高了整体存储性能。EMCVNX系列使用6Gb/sSAS驱动器,并在控制器和驱动器之间利用每端口四个6Gb/sSAS通道(~720MB/sx4=~3GB/s)。提供整体存储IO访问能力。71 EMCVNX存储提供高效的数据服务功能包括数据块压缩、文件重复数据消除和压缩、虚拟资源调配和以应用程序为中心的保护。以及采用虚拟池进行自动分层--FASTwithVirtualPools(FASTVP)可自动跨闪存、SAS和近线(NL)-SAS驱动器进行数据分层和优化。EMC存储系统提供自动存储分层功能(FAST),可以根据用户应用特点,跟据用户制定的数据迁移策略,自动的将活跃数据迁移到固态硬盘,自动的将不活跃的数据迁移到SATA硬盘中。6、VNX存储业界最广泛的兼容性EMC作为全球最大的专业存储产品及解决方案供应商,其产品均具有良好的多平台支持性和互操作性,能够支持主流的各种主机系统和群集系统平台。EMC在美国总部投资31亿美金建立了全球最大的存储互操作实验室,保证任何EMC推荐的存储解决方案均经过实验室实际测试。71 第一章项目一期数据保护系统整合技术方案1.1主机房本地数据保护方案根据数据中心不同的业务系统对备份恢复的要求不同,EMC建议主机房的备份平台建设规划按以下方式进行:l对客户的备份恢复服务要求进行服务等级划分,定义不同服务等级的备份恢复服务要求;l定义不同备份恢复服务等级的参考架构l根据业务的重要性等级进行备份恢复服务等级映射,并选择合适的参考架构。l根据各业务系统的备份恢复现状制订改造计划。71 在主机房,EMC向用户推荐带有重复数据删除技术的高性能的EMC虚拟磁盘库DD860(裸容量56TB)的解决方案,同时配合客户现有的备份软件和NetApp虚拟磁盘库,提供高效的不同服务等级备份恢复解决方案。选择重复数据删除虚拟带库的优势使用虚拟磁带库备份就像真实的、自动化的物理磁带库/机设备一样,仅仅是将数据存储在磁盘上。虚拟带库是将磁盘仿真成磁带库,使备份服务器对此磁盘的操作如同操作一个磁带库一样,使磁盘代替磁带作为备份操作中存储数据的设备,而这种改变对于用户来说完全是透明的,用户完全不对原有的备份脚本做任何改变来完成备份作业。虚拟磁带库备份多基于SAN架构,和磁盘备份一样,虚拟带库备份也根据是否占用生产主机CPU资源分为LAN-Free备份和Server-Free备份两种,两种备份的架构和磁盘备份中LAN-Free和Server-Free中一样,数据流也是一样,不同的就是备份终端设备由磁盘阵列换成了虚拟磁带库,此处不再赘述。虚拟磁带库利用SAN环境进行备份,除了能充分利用SAN环境高性能,不增加额外网络开销的特点外,还具有如下优点:l采用虚拟磁带库可以沿用原来基于磁带的备份架构,避免备份架构改造的成本和风险,同时具备备份到磁盘介质的风险。l虚拟磁带库把磁盘空间仿真成磁带使用,因而无需进行文件系统管理,大大简化了管理要求。l数据备份到虚拟磁带后,该磁带可以由其它服务器读取,在需要进行备份数据迁移到物理磁带上时,将无需原生产机参与,避免对生产的影响。l一台虚拟带库设备可以模拟多台磁带库,因而对数据中心而言,可以提供虚拟带库服务,使得不同客户有自己的磁带库,并且支持同一客户多种备份软件平台。l虚拟磁带库容量可以初始分配一个较小容量,以后根据需要自动分配实际空间,可以大大提高利用率。l利用虚拟磁带库缺省的重复数据删除技术(De-Dup)可将除图片等71 多媒体数据外的数据库数据,文件等实现在线10-400倍的压缩。大大减少虚拟磁带库的磁盘使用空间。例如:客户有10TB的数据库数据,对于虚拟磁带库而言,第一次的全备份大约需要3TB的虚拟磁带库空间,如果客户的备份策略是最终保留8份全备份。那么从第二次全备份开始到第八次全备份,占用的虚拟磁带库空间为大约每次1TB(保守估计)。那么总共需要的虚拟磁带库磁盘配置在17TB左右。再根据未来业务的增长量,提供必要的扩展和预留空间即可。l配置多台虚拟磁带库可以实现低带宽要求的数据异地备份,这是传统物理磁带库无法实现的解决方案,配合EMCDataDomain的多级复制架构,能帮客户打造完整的企业级数据保护整合方案。1.1XX数据保护整合方案根据XX的实际,我们建议采用EMC的领先的解决方案DataDomain产品搭建备份设备的容灾整合系统。具体如下:71 主数据中心:采用备份设备,配置DD860,配置VTL和NAS协议支持,复制软件:主数据中心DD860负责按照既定的备份策略备份数据中心的关键业务数据,最关键的数据,再备份一份到NetApp虚拟带库上。XX容灾数据中心:采用备份设备配置DD860,配置VTL和NAS协议支持,复制软件:DD860负责接收主数据中心DD860复制的关键业务数据的备份数据。从而实现主数据中心和容灾中心备份数据的异地存放和数据的统一异地备份。第一章项目一期XX存储容灾与业务连续性方案建议1.1业务连续性系统建设随着集中存储架构的完善,各级应用的基础数据将不断的汇总核心存储,各业务系统也将更加依赖主机房存储平台来保障业务的正常运转。一旦主数据中心发生较大的问题,将给各业务系统造成长期中断,甚至因基础数据无法找回,造成无可弥补的损失。因此,在此阶段有必要通过容灾系统的建设来保证个业务系统运行的连续性。项目的容灾系统的建设总体目标是:在整合的存储系统基础上,充分利用现有资源的前提下,实现容灾系统的建设,保障应用系统的业务连续性。容灾系统建设容灾系统的建设,是本项目存储平台提供信息系统持续运行的有效手段,如何高效、顺利的实现容灾系统的建设,必须通过一系列的前期分析,确定业务类型、特点,规划一个完整的容灾体系架构;同时,需要制定必要的业务系统应急计划(BCP和DRP),只有系统平台和业务应急计划充分的结合,才能最终保证业务系统中“关键业务7×24小时不中断”运行。容灾方案设计原则71 方案本着技术先进性、可扩充性、高可靠性、高可用性、成熟性、可管理性的设计原则和总体设计思想,集合了EMC公司优秀技术设计理念和产品,借鉴了EMC全球众多成功案例和实际经验,设计了整体的解决方案。技术先进性:系统设计应采用当前先进而成熟的技术,不仅可以满足本期工程的需求,也应把握未来的发展方向。可扩充性:在系统设计时应充分考虑可扩充性,从而确保新功能、新业务的增加在原有的系统平台上扩展和实现。高可靠性:存储平台具有高可靠性,支持服务器平台的高可用性集群技术;具备先进的容灾的设计;充分保证系统的高扩展能力和高容错能力,具有通道负载自动均衡能力和存储系统性能调节能力,提供极为充分的可靠性各项指标设计。高可用性:在不停机情况下,实现不停机扩容、维护、升级等服务,提高性能以满足新的业务需求。具备7×24×365连续工作的能力,系统的可用性应大于99.999%。在自动化管理软件支持下可以实现磁盘数据的在线(不停机)备份。成熟性:应尽量选用经过大量运用、成熟可靠的系统。可实施性:选用成熟的技术,成熟的案例经验和设计方案,制定详细的技术实施方案。1.1.1容灾概述自“9.11”之后,全球各组织均认识到灾难防范保护的重要性。某些大型金融机构之所以能够在两天内恢复营业,其主要原因是它们不仅像一般公司那样在内部进行数据备份,而且在数英里外的数据备份中心也保留着数据备份。这些备份都是通过数据备份软件和数据复制软件进行的。采取了这种措施后,一旦工作现场发生意外,企业就可以立即使用另一套数据。华尔街的金融机构重新对灾难恢复的步骤做了评估,并认识到灾难恢复只是技术手段之一,它们开始强调BusinessContinuity(业务连续性),而不仅仅是DisasterRecovery("灾难"恢复)。因为过去的“灾难”恢复计划并没有强调全局性影响,而如何维持业务的连续运作将成为组织运营风险评估中至关重要的一环。事实证明,只有对数据存储备份制定完备、持续且可执行的容灾计划,特别是业务连续计划,才能为人们提供万无一失的数据安全保护。71 灾难恢复是业务连续性计划的一部分,其中还包括业务恢复计划。灾难基本上可以说是无法预测的,其造成的损失也很难精确的估计,但是有一点可以肯定,灾难的发生对于组织来讲往往是致命的,因此,组织必须有所准备。实施灾难恢复的计划首先对其应用系统进行评估,分清关键的系统,并对其运行环境进行评估,判断发生灾难的可能性有多少。若发生,关键系统中断运行的时间有多长?中断后对组织的影响有多大?有多少?哪些资料会丢失,有没有解决的办法和措施等。EMC公司的专业服务可以为您提供这些评估服务,这些咨询服务是根据组织的关键系统、数据量、交易量、网络和数据保护情况等因素做出对业务影响分析报告,进而做出解决方案,从而保证当灾难发生后对您业务和应用的影响降至最低。风险与灾难风险主要是可能导致系统中止运行、业务中断并给组织和客户造成重大影响的潜在事件或事故。本系统建设需要通过一系列手段来尽量防止风险发生。灾难是已经发生,并导致系统中止运行、业务中断,给组织和客户造成重大影响的事件或事故。本建设需要通过一系列手段(如容灾演习,灾难切换流程等)来减少灾难发生后对业务连续运行带来的影响。业务系统主要面临的风险有:计划内l应用软件等的升级l备份/恢复/归档l数据中心迁移、整合l测试、容灾演习等计划外l系统处理能力下降l人为操作故障:错误删除数据;错误执行程序或命令等l系统软硬件故障,主要包括电源及UPS故障、硬盘故障、通讯控制器故障、系统总线、内存、CPU故障等71 l安全体系被攻破l供电系统瘫痪l水灾、火灾、瘟疫、地震及其他机房事故等风险发生的概率分为比较可能、可能、基本不可能三种级别。根据级别对风险进行分类的结果见下表,表中概率级别是指在大多数情况下此风险的发生概率。比较可能可能基本不可能建筑物结构性破坏、水管爆裂、火灾等环境紧急事件(污染等)战争人为破坏/过失(对公司不满的员工,外部黑客,计算机病毒等)城市事件(动乱、罢工等)恐怖主义升级、检修等计划性宕机社会性恐慌设备、软件瘫痪地震基础设施故障(电源、空调故障)气候灾难(台风、洪水等)业务影响分析(BIA)业务影响分析(BusinessImpactAnalysis)实质上就是对关键性的系统功能、以及当这些功能一旦失去作用时可能造成的损失和影响的分析。对于业务运营的关键人员来说,他们需要分析:影响n哪种功能对于整体战略而言是生死攸关的n该功能在多长时间内失效不会造成影响和损失n其他业务功能由于该功能的失效会受到何种影响——运营影响分析n什么是最大的/可承受的/可允许的失效业务恢复需求n要使该功能连续,需要哪些资源和数据纪录n最少的资源需求是什么71 n哪些资源可能来自外部n它与其他功能的依赖关系以及依赖程度n其他功能与该功能的依赖关系以及依赖程度n该功能与外部系统的依赖关系以及依赖程度n在缺少试验环境的情况下进行恢复,需要采取怎样的预防措施或检验手段在进行了这些分析之后,才有可能对各种功能进行分类:n关键功能——如果这类功能被中断或失效,就会彻底危及业务并造成严重损失。n基础功能——这些功能一旦失效将会严重影响长期运营的能力。n必要功能——可以继续运营,但这些功能的失效会在很大程度上限制系统的效率。n有利功能——这些功能是有利的;但它们的缺失不会影响系统的运营能力。应用系统重要性分析并非所有的应用系统都是非常重要的,每种应用系统的停顿对组织造成的影响也不相同。因此,在实施灾难复原之前应对应用系统进行分类,再分别制定灾难复原的策略和确定投资。不同的应用对组织的影响如下图:71 不同应用系统中断后所导致的结果有一些行业对计算机应用系统的停顿非常敏感,停顿对组织的影响也会很大。如下图所示:灾难发生后不同行业的损失状况如电信业计算机应用系统的停顿一小时,将导致美金两百万元的营运损失,因此为了降低灾难造成的影响,纷纷实施灾难复原计划。1995年全球在业务连续性项目投资为31亿美元,2000年达到了70亿美元,并在不断增加。目前约有70%的金融业、55%的零售业和43%证券、保险业企业实施了业务连续性计划。在发生的灾难中,供电故障占约28%、雷击占11.7%、电源波动占5.1%、地震占4.9%。RTO和RPO71 在详细讨论容灾的技术前,首先要明确的是灾难复原的目的不是仅仅得到相同的数据拷贝,而是如何在灾难发生后如何复原应用的运行,重要的是如何保证灾难发生后备份的数据可用。数据库环境是实施灾难恢复计划中常会遇见也是最常见的风险。当遇到突发事件,数据库的复原可以通过紧急启动(EmergencyRestart))或完全恢复(FullRecovery)。完全运作是在数据库数据损坏到一定程度所采用的方式之一。在完全运作过程中,需要将最近备份的数据(通常是磁带)Restore到主机上,再用日志追补未备援(丢失的)数据,这一过程通常需要一天或几天的时间(视数据量而定)。如若采用硬件储存设备远程备份技术的话,此回复过程将会快速许多也降低维护人员复杂处理程序。恢复时间目标(RecoveryTimeObjective,简称RTO):RTO表示了从灾难发生直到业务流程再次运行(即被恢复)的时间。RTO有两个组成部分,明确灾难发生后指示恢复流程开始的决策时间(DecisionTime)和进行灾难恢复流程的实施时间(DeploymentTime)。一般来说,恢复时间(RTO)越短,那么灾难恢复方案的成本就越高,但是由于灾难造成的业务损失就越小;反之,恢复时间(RTO)越长,灾难恢复方案的成本较低,但是由于灾难造成的业务损失就较大;恢复点目标(RecoveryPointObjective,简称RPO):RPO是灾难发生后业务能够容忍的数据丢失量,或者说灾难发生造成的数据丢失量。一般来说,RPO越高(即,丢失的数据越少),容灾的成本越高,但是由于灾难造成的业务损失就越小;反之,RPO越低(即,丢失的数据较多),容灾的成本越低,但灾难造成的业务损失也越大。业务持续计划(BCP)BCP是一套用来降低组织的重要营运功能遭受未料的中断风险的作业程序,它可能是人工的或系统自动的。业务持续计划是高层管理人员的首要职责,因为他们被委任于保护公司的资产及公司的生存。业务持续计划的目的是使得一个组71 织及其信息系统在灾难事件发生时仍可以继续运作。为了能对灾难事件有适当的对策,严密的计划及相关资源的投入是必须的。灾难恢复计划(DRP)正如其名字所表示的,DRP应用于重大的、通常是灾难性的、造成长时间无法对正常设施进行访问的事件。通常,DRP指用于紧急事件后在备用站点恢复目标系统、应用或计算机设施运行的IT计划。DRP的范围可能与IT应急计划重叠,但是DRP的范围比较狭窄,它不涉及无需重新配置的小型危害。根据机构的需要,可能会有多个DRP附加在BCP之后。1.1.1容灾技术简介容灾的7个层次容灾系统的7个层次l0层-没有异地数据(Nooff-siteData)Tier0即没有任何异地备份或应急计划。数据仅在本地进行备份恢复,没有数据送往异地。事实上这一层并不具备真正灾难恢复的能力。l1层-PTAM卡车运送访问方式(PickupTruckAccessMethod)71 Tier1的灾难恢复方案必须设计一个应急方案,能够备份所需要的信息并将它存储在异地。PTAM指将本地备份的数据用交通工具送到远方。这种方案相对来说成本较低,但难于管理。l2层-PTAM卡车运送访问方式+热备份中心(PTAM+HotSite)Tier2相当于Tier1再加上热备份中心能力的进一步的灾难恢复。热备份中心拥有足够的硬件和网络设备去支持关键应用。相比于Tier1,明显降低了灾难恢复时间。l3层-电子链接(ElectronicVaulting)Tier3是在Tier2的基础上用电子链路取代了卡车进行数据的传送的进一步的灾难恢复。由于热备份中心要保持持续运行,增加了成本,但提高了灾难恢复速度。l4层-活动状态的备份中心(ActiveSecondaryCenter)Tier4指两个中心同时处于活动状态并同时互相备份,在这种情况下,工作负载可能在两个中心之间分享。在灾难发生时,关键应用的恢复也可降低到小时级或分钟级。l5层–两个活动的数据中心,确保数据一致性的两阶段传输承诺(Two-SiteTwo-PhaseCommit)Tier5则提供了更好的数据完整性和一致性。也就是说,Tier5需要两中心与中心的数据都被同时更新。在灾难发生时,仅是传送中的数据被丢失,恢复时间被降低到分钟级。l6层-0数据丢失(ZeroDataLoss),自动系统故障切换Tier6可以实现0数据丢失率,被认为是灾难恢复的最高级别,在本地和远程的所有数据被更新的同时,利用了双重在线存储和完全的网络切换能力,当发生灾难时,能够提供跨站点动态负载平衡和自动系统故障切换功能。远程数据复制技术简介71 在容灾系统中,关键要解决的就是如何将数据从生产中心复制到灾备中心。下面我们就几种数据复制技术进行对比。数据复制技术的实现基于应用程序容灾解决方案n应用程序在本地、远端双写I/On复杂、麻烦、不稳定、效率低基于数据库复制的容灾解决方案数据库复制技术中,OracleDataGuard是专门针对Oracle数据库而开发的。OracleDataGuard技术是Oracle数据库系统特有的灾难备份和恢复技术,利用了Oracle数据库系统的日志备份和恢复机制。DataGuard的基本原理是在与主系统完全一致的硬件和操作系统平台上建立后备数据库系统,同时对主数据库的数据库日志(Log)和控制文件等关键文件进行备份。在主系统正常工作的同时将主系统产生归档日志文件(ArchivedLog)不断的传送到后备数据库系统,并且利用这些日志文件在后备数据库系统上连续进行恢复(Recover)操作,以保持后备系统与运行系统的一致。当主系统发生故障时,使用备份的数据库日志文件在后备数据库上恢复主数据库内的数据。71 采用OracleDataGuard技术进行灾难备份需要满足以下前提条件:n后备系统与主系统的硬件平台、操作系统、操作系统版本等保持一致;n后备系统与主系统上Oracle用户的权限一致;n后备系统与主系统的Oracle数据库版本一致;n后备系统与主系统的Oracle数据库配置文件一致。所以,OracleDataGuard技术也存在着一下局限:nOracleDataGuard的数据复制时将对生产数据库系统的性能产生影响,因而需要更多的处理资源;n后备数据库不可用,如果用户需要在远程数据中心使用生产数据给开发测试、DW/BI应用使用将非常困难。n只能对Oracle数据库数据提供保护,不能对其它应用数据—如文件应用等提供灾难保护。n管理复杂,需要大量的人工干预过程,容易发生错误。n只能保护Oracle数据库,无法保护其他应用数据。基于主机的数据复制软件容灾解决方案采用基于主机系统的容灾方式的核心是利用主、备中心主机系统通过IP网络建立数据传输通道,通过主机数据管理软件实现数据的远程复制,当主数据中71 心的数据遭到破坏时,可以随时从备份中心恢复应用或从备份中心恢复数据,从而给企业提供了应用系统容灾的能力。实现远程数据复制的数据管理软件有很多产品,主机厂商和一些第三方软件公司(如赛门铁克公司)提供基于主机的数据复制方案,如VeritasVolumeReplicator(VVR)等软件可实现基于主机的远程数据复制,从而构建基于主机的容灾系统。基于主机的数据复制技术容灾解决方案有以下优点:n基于主机的方案最主要的优点是只对服务器平台和主机软件有要求,完全不依赖于底层存储平台,生产数据中心和后备数据中心可以采用不同的存储平台;n既有针对数据库的容灾保护方案,也有针对文件系统的容灾保护方案。n有很多不同的基于主机的方案,可以满足用户的不同数据保护要求,提供多种不同数据保护模式;n基于IP网络,没有距离限制虽然,基于主机的数据复制技术容灾解决方案有一些优点,但同时也存在着更多局限:n基于主机的方案通常需要同种主机平台;n基于主机的数据复制方案由于生产主机既要处理生产请求,又要处理远程数据复制,必须消耗生产主机的计算资源,因而对生产主机性能产生较大的影响,甚至是产生严重影响;n灾备中心的数据一般不可用,如果用户需要在远程数据中心使用生产数据给开发测试、DW/BI应用使用将非常困难;n利用主机数据复制软件的方案比较复杂,尤其是和数据库应用结合的时候需要很复杂的机制或多种软件的结合,从而对生产系统的稳定性、可靠性、性能带来显著影响;71 n如果有多个系统、多种应用需要灾难保护,采用基于主机的方案将无法有统一的技术方案来实现。n管理复杂,需要大量的人工干预过程,容易发生错误。基于存储的数据复制容灾解决方案基于存储的容灾方案的技术核心是利用存储阵列自身的盘阵对盘阵的数据复制技术实现对生产数据的远程拷贝,从而实现生产数据的灾难保护。在主数据中心发生灾难时,可以利用灾备中心的数据在灾备中心建立运营支撑环境,为业务继续运营提供IT支持。同时,也可以利用灾备中心的数据恢复主数据中心的业务系统,从而能够让企业的业务运营快速回复到灾难发生前的正常运营状态。采用基于存储的数据复制技术建设容灾系统是目前金融电信企业、政府采用较多的容灾方案,有非常多的应用案例,是·单位未来容灾建设可选择的技术方案之一。基于存储的容灾方案有两种方式:同步方式和异步方式,说明如下:同步方式,可以做到主/备中心磁盘阵列同步地进行数据更新,应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列将利用自身的机制(如EMC的SRDF/S)同时将写I/O写入后备磁盘阵列,后备磁盘阵列确认后,主中心磁盘阵列才返回应用的写操作完成信息。异步方式,是在应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列立即返回给主机应用系统“写完成”信息,主机应用可以继续进行读、写I/O操作。同时,主中心磁盘阵列将利用自身的机制(如EMC的SRDF/A)将写I/O写入后备磁盘阵列,实现数据保护。采用同步方式,使得后备磁盘阵列中的数据总是与生产系统数据同步,因此当生产数据中心发生灾难事件时,不会造成数据丢失。为避免对生产系统性能的影响,同步方式通常在近距离范围内(FC连接通常是200KM范围内)。71 而采用异步方式应用程序不必等待远程更新的完成,因此远程数据备份的性能的影响通常较小,并且备份磁盘的距离和生产磁盘间的距离理论上没有限制(可以通过IP连接来实现数据的异步复制)。采用基于存储数据复制技术建设容灾方案的必要前提是:l通常必须采用同一厂家的存储平台,通常也必须是同一系列的存储产品l采用同步方式可能对生产系统性能产生影响,而且对通信链路要求较高,有距离限制,通常在近距离范围内实现(同城容灾或园区容灾方案)l采用异步方式与其他种类的异步容灾方案一样,存在数据丢失的风险,通常在远距离通信链路带宽有限的情况下实施。EMC公司的存储系统建设容灾方案有非常广泛的应用,这主要是由于基于存储的容灾技术方案有如下优点:l采用基于存储的数据复制独立于主机平台和应用,对各种应用都适用,而且完全不消耗主机的处理资源。l采用同步方式可以完全不丢失数据,在同城容灾或园区内容灾方案中,只要通信链路带宽许可,完全可以采用同步方案,而不会对主数据中心的生产系统性能产生显著影响。采用EMC基于存储的同步复制方式的容灾案例有很多,有非常多的成功经验,如辽宁移动、黑龙江移动都采用了EMC同步复制技术,并能满足大规模I/O吞吐情况下的同步数据复制要求。l采用异步方式虽然存在一定的数据丢失的风险,但没有距离限制,可以实现远距离保护。l灾备中心的数据可以得到有效利用。l对于基于应用、基于主机、基于存储的三种容灾方案而言,灾备中心的数据通常不可用,仅为生产系统中的数据提供灾难保护和灾难恢复。但对采用基于存储技术的容灾方案中,有很灵活的技术手段可以充分利用灾备中心的数据,从而提高企业的业务运营效率,带来更多的投资回报。71 EMC的存储系统虚拟化平台:V-PLEX的容灾特点EMC存储虚拟化VPlex解决方案可在XX数据中心内进行信息虚拟化、访问、共享和迁移。它是世界上第一个同时提供本地联合和分布式联合的平台。本地联合提供机房内信息基础架构的透明协作。分布式联合跨远距离扩展两个位置之间的访问能力。VPLEX是一个用于联合EMC和非EMC存储的解决方案。EMCVPLEX引入了一种新的体系结构,它吸收了EMC在20多年设计、实施和完善企业级智能缓存和分布式数据保护解决方案实践中取得的丰富经验。以可扩展、高可用的处理器引擎为基础,EMCVPLEX设计为可从小型配置无缝扩展到大型配置。VPLEX驻留在服务器和异构存储资产之间,使用独特的群集体系结构,该体系结构允许多个数据中心的服务器具有对共享块存储设备的读/写访问权限。新体系结构的独特特征包括:•横向扩展群集硬件,允许您从小配置开始并以可预知的服务级别逐步扩展•高级数据缓存,它利用大规模SDRAM缓存提高性能并减少I/O延迟和阵列争用•分布式缓存吻合性,可跨整个群集自动执行I/O的共享、平衡和故障切换•一个统一视图显示跨VPLEX群集的一个或多个LUN(这些群集可以是在同一数据中心内相距几英尺,也可以是跨同步距离),从而实现新的高可用性和工作负载移置模式。VPLEX系列包括多个产品,同步距离的产品:VPLEXLocal和VPLEXMetro。•VPLEXLocal支持本地联合,可跨异构阵列提供简化的管理和无中断数据移动。71 •VPLEXMetro提供分布式联合能力,扩展了同步距离内两个位置间的访问能力。VPLEXMetro利用AccessAnywhere支持跨远距离共享、访问和移置单个数据拷贝。提供同步距离内两个VPLEX群集之间的数据访问和移动。1.1XX容灾系统方案架构设计综合考虑本项目的总体规划,主数据中心和容灾数据中心双活数据中心方案可基于存储虚拟化功能实现,在主数据中心主阵列与灾备数据中心的备份阵列之间形成池化的存储空间。如下图:71 1.1建议的XXVPlexMetro方案的优势建议XX,在有条件的情况下部署VPLEX,实现跨阵列的不中断应用的情况下,允许用户从不同地理位置同时访问单个数据副本,数据迁移,数据中心间整合数据。虚拟化整合多个存储,提供单个数据副本非常好理解。下面就数据迁移,数据中心间整合数据说明如下。数据迁移让任何一位存储专业人员列出他们面临的最大难题,数据迁移总会处在或靠近这一难题列表的顶部。通常,在实施用新的存储系统(如VNX7500)替换旧式存储的技术更新计划期间,需要进行数据迁移。随着性能和可用性需求的变化,还可能需要进行数据移置,以在位于不同存储系统上的存储层之间移动数据。在信息的生命周期中,数据对企业的价值会有所变化,而且可用性和性能方面的变化可能会要求将数据移向高层或低层。例如,当应用程序处于开发阶段时,性能和可用性可能不如在完全投入生产应用时那样重要,因此,开发和测试环境可以利用更经济划算的存储。当应用程序移入生产环境中时,数据可用性和性能会提高,可能需要将数据移向更高层。随着生产活动升级,可能要求更高的服务级别,因此部分或全部数据可能需要最高性能存储,例如企业级闪存驱动器提供的存储。如果超高性能存储是在同一存储系统内,则可能要利用诸如虚拟LUN技术这样的功能在阵列内无缝移动数据。如果超高性能存储位于不同的存储系统中,则要求在系统之间执行数据迁移。有许多不同的工具可用来简化存储系统之间的数据迁移。有些是基于主机的或者是内置于主机逻辑卷管理器中的功能。尽管这些工具适用于某些情形,但是它们要使用主机资源,并要求服务器和应用程序管理员参与。其他工具是基于阵列的,如SANCopy™。EMCVPLEX提供了第三个选项,那就是基于SAN,这样数据就可以在阵列之间无中断地移动,而不需要主机或存储系统的直接参与。利用EMCVPLEX,呈现给主机的存储可以在后端存储阵列之内和阵列之间的不同存储层间无中断地移动。我们使用一个示例:迁移的源卷驻留在一个异构存71 储系统上,目标卷驻留在一个VNX阵列上。可以在应用程序不中断的情况下实现数据从异构存储系统到VNX的迁移。可聚合数据中心存储并提供全天候IT服务VPLEX使用一个独特的群集体系结构,让用户可以消除数据中心的物理界限,并允许多个数据中心的服务器具有对共享块存储设备的读/写访问权限。VPLEXLocal配置定义为有一、二或四个VPLEX引擎,它们通过其充分冗余的引擎间结构互连集成到单个群集中。此群集互连功能支持在线添加VPLEX引擎,因而为VPLEXLocal和VPLEXMetro配置提供了优异的可扩展性。VPLEX群集节点之间以及跨VPLEXMetro配置的所有连接是充分冗余的,确保了针对单点故障的保护。VPLEX群集可通过添加更多引擎进行纵向扩展,通过将群集连接到VPLEXMetro中进行横向扩展(两个VPLEXMetro群集在城域网距离内连接起来)。VPLEXMetro有助于透明地移动和共享工作负载(包括虚拟化主机),整合数据中心,和跨数据中心优化资源利用率。此外,它提供了无中断数据移动、异构存储管理和改进的应用程序可用性。VPLEXMetro最多支持两个群集,这两个群集可以位于同一数据中心内,或位于两个在同步距离(大约相距60英里或100公里)内的不同站点。下图显示VPLEXMetro系统在数据中心中的部署。“数据中心间的VPLEXMetro部署”类似于此,只是群集放置在不同的数据中心。这通常意味着各群集分别连接了不同的主机。举例来说,群集化的应用程序可以将一组应用程序服务器部署在数据中心A,将另一组部署在数据中心B,以增加弹性和工作负载移置优势。71 在数据中心间部署VPLEXMetro适合于这样的情形:希望获得通过将应用程序数据同时存放在两个数据中心而增加的工作负载弹性优势。在以下情形下也建议使用此部署:•一个数据中心中的应用程序希望访问另一数据中心中的数据。•一个应用程序希望在两个数据中心之间重新分布工作负载。•一个数据中心的空间、电力或冷却容量已用尽。采用以上部署将使VPLEX为应用程序增加可用性,让它们的工作负载能够度过如下故障情形:•存储阵列停机(计划内和计划外)•SAN停机•VPLEX组件故障•VPLEX群集故障•主机故障•数据中心停机1.1容灾项目实施与演练项目实施71 业务连续性服务集成方法论(BusinessContinuitySolutionIntegration,简称BCSI)是EMC通过对多年实施业务连续性和容灾服务的所积累的经验进行总结和提炼,开发出来的业务连续性实施方法论模型,该实施方法在全球众多相关项目中广为使用并得到验证。如下图所示,EMC在业务连续性服务方面有着一套完整的实施方法论,它包括规划(Plan)、建立(Build)、和管理(Manage)三个阶段的咨询和技术服务。以下对EMCBCSI实施服务方法论作概要描述。评估当前的服务水平与业务单位回顾并确认服务水平协议(SLAs),并确定各业务应用的RTO和RPO。针对每个应用,评估当前的系统架构和运作能力;并确定当发生故障或灾难时,当前系统的可用性、RTO和RPO。明确存在的弱点。确定当前系统的可恢复能力。定义业务需求回顾并验证现有的服务水平协议。更新恢复和可用性服务水平定义。71 将各个业务流程映射到相应的应用系统、基础设施和运作管理上。明确各业务流程对应用系统和基础架构的依赖关系。评估可用性和恢复技术基于数据分层的模型,进行系统架构平台的分析,设计可行的系统架构。对可选的恢复技术进行评估。建立高层次成本估算基础架构设计根据业务连续性需求的恢复策略,回顾当前的系统架构连接,系统配置和容量规划。衡量当前的应用性能及服务水平。分析容量需求。选择合适的技术来满足所需的服务水平。提出对硬件、软件和网络配置的详细建议。提出全面的技术架构来指导方案的实施。实施规划制定详细的技术实施计划。回顾项目实施方法。确认项目实施的逻辑和流程。定义项目实施的限制条件。制定详细的项目计划。制定成本计划以平衡开发、测试、和维护等活动。测试及实施71 安装并配置必需的恢复系统架构组件(硬件/软件)。按计划对应用进行迁移,并降低系统停机时间。新系统架构的测试。在新的系统架构中,稳定应用的运行。对系统设计的准确性和完全性进行回顾。开发恢复及切换计划通过研讨会来指导开发应用恢复流程。开发并且书面化应用系统的切换及回切步骤。开发并且书面化业务连续性计划。集成测试和演习制定演习场景。制定演习计划。确定参与人员确定期望的结果和成功要素实施演习业务连续性更新明确业务连续性目标。确定人员和技能要求。根据既定需求,确定所需的行动以确保系统架构和运作的可行性。回顾当前的变更管理、配置管理和发布管理的流程。修正和完善。资源管理、改进及衡量回顾资源需求和技能状况。71 检查变更管理流程、步骤和文档资料。分析关键的性能指标(KPI)及趋势。教育及培训。容灾演练容灾项目成功标准容灾项目的成功不能按传统IT建设项目来进行衡量,将需要从“技术平台建设层面、人员组织及管理流程建设层面”同时进行衡量。EMC建议参考以下方面来评估容灾项目的成功:n技术平台建设层面衡量参考标准ü各厂商的设备与应用安装完成,联调通过、测试正常ü数据成功复制到容灾中心,RPO符合要求,数据可用性测试通过ü数据复制对正常生产没有性能影响或没有明显性能影响ü模拟容灾测试(切换演练)成功n人员组织及管理流程建设层面参考标准ü建立了完善的容灾管理组织机构,并有明确的职责分工ü建立了完善的灾难恢复计划(DRP)或业务连续性计划(BCP),包括详细、完善的容灾切换操作步骤和流程。ü真实容灾演练成功,RTO、RPO达到预期目标ü建立了容灾系统管理机制ü建立了定期的演练机制ü相关人员经过培训,统一了对容灾的认识,了解各自的职责和在进行灾难切换、容灾演练的行动计划容灾演习建议71 容灾演习的目标是确保容灾系统的可用性和灾难恢复流程的有效性,在启动容灾中心接管业务时,验证容灾系统是否能够达到预期的指标。真实的容灾演习是检验整个容灾项目的重要手段和里程碑。通过演习,可以对相关维护人员进行实际操作培训,发现容灾相关流程的不足并进行优化。EMC建议容灾项目在系统建设完成后,进行一次真实演练,作为容灾项目验收的重要手段。同时,EMC建议未来必须进行定期或不定期的进行容灾演习,以检验系统的可用性、有效性和稳定性,最好每年至少1次真实的容灾演练。真实容灾演练建议满足以下要求:n演习前制订完善的演习规划。演习规划需要考虑演习方式、范围、参与人员、时间进度、指挥控制等。n各容灾职能小组具备详细的操作手册n真实演习前要进行桌面演练n演习要按照规划进行n演习过程要有详细的记录n演习后要进行总结,并根据需要维护相应的业务连续性计划EMC咨询服务已经有丰富的容灾演习规划、指导经验。目前中国客户进行的真实容灾演练基本都由EMC规划并指导客户完成,都获得了非常好的效果。EMC咨询团队将愿意与客户合作,为容灾演练提供完善的咨询服务,从演习规划到实际真实演习指导、指挥控制、流程等各方面提供咨询服务。EMC容灾演习咨询服务内容如下:容灾演习规划与演习指导工作内容l准备容灾演习规划的讨论材料。l召开容灾演习规划的研讨会议,并就以下内容进行讨论:n演习规划的方法n演习目标n演习范围n演习策略71 n演习场景n完成标准n应急回退计划n演习风险控制等n演习进程控制n人员分工与配合n演习联络通信机制等…l与相关厂商共同设计演习技术方案。l编制《容灾演习计划》。l指导一次真实演练,并进行评估、总结,提出改进意见交付件l《容灾演习计划》(MicrosoftWord格式)l《演习总结汇报》第一章项目一期存储系统EMC设备清单根据项目需求,建议一期配置下列产品。配置汇总表格:数量每台设备配置说明总价磁盘阵列系统VNX75002u硬盘可用容量500TB(335*600GBSAS)u冗余控制器u48GB缓存u16个前端8GbFC主机端口u8个前端10GBFCoE主机接口u8个6Gb/s宽SAS2.0磁盘通道u基本管理软件u多路径软件u原厂商存储系统实施,原厂商培训等760万71 思科MDS9148交换机2思科MDS9148采用了非阻塞架构,配置了48个8Gbit/秒(全双工)端口,配置单模模块。28万思科CiscoNexus3064交换机2思科Nexus3064采用了非阻塞架构,配置了64个10Gbit/秒(全双工)端口,支持PCoE,配置多模模块。72万虚拟带库DD8602u裸容量56TB,最高可支持500TB以上的逻辑备份数据u2个FC端口uVTL备份许可u复制软件u基本管理软件u原厂商系统实施,原厂商培训等260万存储虚拟平台VPlexMetro1u提供对后端支持1PB虚拟化功能u每个数据中心虚拟平台支持16个FC主机接口,16个FC后端接口u每个数据中心虚拟平台双控制器u每个数据中心虚拟平台72GB缓存u原厂商存储系统实施,原厂商培训等460万数据迁移,容灾咨询,培训服务1u原厂商数据迁移实施u容灾设计咨询u原厂商培训80万71 第一章EMC系列产品行业内/外成功应用案例在众多的军工企业的数据整合项目中,EMC产品系列被作为首选。并多采用了EMC的SAN架构、备份容灾方案。典型用户包括:l航天航空众多研究院,所l兵器工业众多所,厂l中航信l铁路信息中心l一汽集团数据中心l海尔集团数据中心l科学院天文台l科学院网络中心l卫星资源中心l清华大学l等等第二章总结XX存储基础架构不是一个产品的简单累加,而是一个整体规划,好的基础架构应该具有很好的适应性、灵活性、扩充性,它的优势随着时间的推移而越发明显,EMC公司的解决方案就是这样的信息基础架构。概括讲,EMC公司产品解决方案可以保证客户健康地走得更远、走得更好。EMC公司提供给客户的是面向未来的信息基础架构。71 第一章EMC公司专业存储服务介绍使用EMC的专家服务和支持减少风险,降低成本,加快业务价值实现。EMC专业人员通过真正的解决方案经济高效地帮助您达到业务目标并实现信息生命周期管理(ILM)的好处。从评估您的当前状态和确定业务目标到构建一个战略,再到实施、管理和维护您的信息基础结构。规划:EMC咨询服务制定能够解决您最关键的业务/IT困难点的ILM战略。我们的专家可以推荐能在信息生命周期中的每个阶段提高信息业务价值的体系结构和操作改进。构建:实施和集成凭借在EMC平台、软件、解决方案,以及主流的跨平台操作系统方面的高超技能,我们的交付、整合和数据迁移专业人员可让您的存储很快就运行起来——只有极小的中断。管理:EMC管理服务现场提供您所需的存储管理资源和专业技能。从日常操作支持到具体的操作建议和改进,以及对您的存储操作和资产的全面管理。支持:EMC客户服务有了EMC一流的客户服务组织的帮助,您可以高枕无忧了。在为您提供保持全天候运行所需的服务的过程中,我们的全球支持中心、远程支持技术、电子服务、最佳做法和经验丰富的现场客户工程师都发挥了作用。培训通过接受“EMC全球教育”的一系列重要培训选项,使您的技术技能保持最新,提高生产效率,并从您的EMC投资中获得最大的价值。而且,通过获得EMC认证专家计划的认证,您可以为公司做出更多贡献,并促进自己的事业发展。融资71 使用为EMC产品、服务和解决方案提供的一系列灵活的采购选项,可以节约资金,减少风险并改善您的财务状况。第一章EMC公司专业培训介绍项目现场培训:为了使本项目单位的技术人员对存储系统有一个基本管理的认识,我们将提供免费的现场培训,人员数量不限。培训的主要内容包括:存储硬件识别,基本软件界面浏览,告警信息了解等内容。项目课堂培训:培训设施介绍:EMC全球培训部在世界多个国家设立了几十个正规的培训中心,培训主要由这些培训中心承担。此外,还可以利用EMC独到的远程设备,根据客户的需求,在这些培训中心以外的地点实施培训。国内培训中心:教室:目前在中国,北京和上海分别有一个培训中心。北京的培训中心有两间教室,上海的培训中心有一间教室,所有教室均可容纳最多30人参加培训。北京培训中心教室之一(黄河)71 上海培训中心教室(扬子江)设备:培训设备分为两种,一种是本地设备,另外一种是远程设备。本地设备由中国技术解决方案中心提供。中国技术解决方案中心是EMC在全球设立的5个技术解决方案中心之一,其他4个分布在美国、爱尔兰、日本和韩国。该中心拥有EMC所有产品线的全部最新产品,向用户提供演示、概念验证、测试、技术开发和培训等服务。另外,技术解决方案中心还有简报中心,可根据客户需要利用中心的设施组织各类相关报告会活动,为客户提供全面深入了解EMC发展战略和解决方案的机会,并与客户共享各种国内外成功案例。中国技术解决方案中心在北京、上海、广州、香港和台北设有实验室,如有特殊要求,培训也可安排在除北京和上海以外的其他三地进行。中国技术解决方案中心北京机房(内向外视角)71 中国技术解决方案中心北京机房(外视角)中国技术解决方案中心上海机房远程设备是一种基于IP网络的实验方式,实验中被操作的设备物理上位于美国和欧洲,全世界所有的培训都可通过IP网络来实现培训中的实验内容。有些培训课程的实验需要的设备非常多,超过了本地实验室所能提供设备的限度,这样的培训将使用远程设备来对动手实验内容提供支持。此种实验设备访问方法也为培训地点的选择提供了更大的灵活性,只要满足一定网络性能的地点,均可实施EMC培训。培训内容完全涵盖所有招标书中涉及的软硬件产品,所有课程均为中文授课,课程的50%为讲解,50%为实验。比如VNX主要内容:l能配置HBA卡连接VNX存储系统l了解光纤交换机的功能71 l能配置和管理光纤交换机Switch,在其基础上建立有效的zone,能识别端口类型l能通过直接连接或SAN的方式将VNX存储设备与LINUX/UNIX或WINDOWS的主机连通l初始化存储系统l安装和设置PowerPathl进行双host与双交换机的连接,并执行本地的硬盘复制第一章设备介绍1.1EMCVNX7500统一存储系统产品简介:各种类型的组织都依赖及时的信息检索来促进交易和作出决策。尽管典型的组织正在经历两位数的数据增长,但IT预算、人员配备和传统的存储容量却跟不上步伐。因此,IT部门不断承受着巨大压力:使用更高效的存储策略和加大员工可以管理的数据量但不增加员工。客户正在寻找存储供应商以提供创新方法来解决这些难题,就像采用服务器虚拟化让效率大大提升一样,服务器虚拟化是根据业务需求池化服务器资源并对计算机处理能力进行动态资源调配来实现这一点的。而存储面临的要求不仅仅是根据业务活动动态移动信息,而且还要使该过程完全自动化和自我管理。71 EMC®VNX™系列通过可扩展的易用解决方案,提供处理文件、数据块和对象存储的行业领先的创新型和企业级功能。这种新一代存储平台将强大、灵活的硬件与高效率、管理和保护软件结合在一起,能够满足当今企业的严苛要求。从价格合理的入门级解决方案到可满足最严苛应用程序要求的高性能、PT级容量配置,应有尽有,可任由您选择。VNX系列包括VNXe系列,VNXe系列专为较小环境中的IT经理量身打造,而VNX系列旨在满足大中型企业对高性能、高可扩展性的要求。主要特性与优势:VNXe系列—简单、高效且价格合理在开发VNXe系列时,我们时刻设身处地为IT经理着想,并为中小型企业以及大型企业的远程办公室和部门提供集成存储系统。VNXe系列入门级价格不到一万美元,使用独特的应用程序驱动的方法提供真正的存储整合解决方案,可将应用程序及其存储融为一体。对于可能只具备有限的存储专业知识的IT经理和应用程序管理员,这种用于管理共享存储且由应用程序驱动的简单方法会使VNXe系列成为他们的理想之选。用于VNXe系列的EMCUnisphere™支持对Microsoft®Exchange、文件共享、iSCSI卷、VMware®和Hyper-V™的存储进行轻松、基于向导的资源调配。内置的高效功能(例如带压缩的文件重复数据消除和精简资源调配)可让操作得以简化,并可节省高达50%的前期存储成本。而旨在便于进行备份、远程数据保护和灾难恢复的软件包包含易于配置的应用程序快照等功能。VNXe系列通过使用冗余组件(电源、风扇和存储处理器)以及动态故障切换和回切功能来支持高可用性。此外,VNXe系列还支持在VNXe系统运行时升级系统软件或硬件。该系列甚至支持对大量资源(例如全面的在线文档、培训和操作方法视频)进行点击式访问,从而拓宽您的知识面并解答问题。VNX系列—简单、高效和功能强大71 VNX系列是一种强健的平台,整合了原有的数据块存储、文件服务器和直连应用程序存储,使组织可以动态增加、共享和经济高效地管理多协议文件系统以及多协议数据块存储访问。VNX操作环境支持MicrosoftWindows®和Linux/UNIX客户端在多协议(NFS和CIFS)环境中共享文件。同时,它还支持将iSCSI、光纤通道和FCoE访问能力用于实现高带宽和对延迟敏感的数据块应用程序。EMCAtmos™VirtualEdition软件和VNX存储结合使用,可支持基于对象的存储,并使客户能够通过EMCUnisphere管理Web应用程序。VNX系列的新一代存储平台由带6-Gb/sSAS驱动器后端的IntelQuadCoreXeon5600系列提供支持,与以前生产的中间层存储相比,性能得到大幅提升:l运行MicrosoftSQL和Oracle的速度比以前快3倍l不到两分钟就可使系统性能翻倍,而且无中断l运行数据仓库的速度快3倍轻松管理、监控和调整存储资产借助EMCUnisphere,可以通过分布式存储环境的简单、集成的用户界面从任何地方管理VNX系统。Unisphere控制面板是一个可进行一览式管理和报告的屏幕,管理员可利用其快速查看并了解整个环境中正在执行的操作以及可采取71 的措施。Unisphere的单点登录会自动发现环境中的所有VNX、EMCCLARiiON®、EMCCelerra®和EMCRecoverPointSE安装,以便进行无缝配置。使用闪存进行优化提高了系统性能VNX系列专门设计为利用闪存驱动器技术的最新创新成果,最大程度提高存储系统的性能和效率,同时将每GB成本降至最低。即使只有数个闪存驱动器与EMCFAST套件(一款无与伦比的强大软件,可对各异构驱动器中的数据进行分层,并将活动最频繁的数据放入缓存中)结合使用,客户也可以体验到“闪存优先”(FLASH1st)策略带来的最佳优势。FLASH只能通过EMC获取,保证客户绝不会因成本和性能而发愁。活动高度频繁的数据由高达2TB的闪存驱动器提供服务,该驱动器带有FASTCache,可以动态吸收系统工作负载中的意外“高峰”。随着数据过期并且活动随时间变得不再频繁,FASTVP(针对虚拟池的全自动存储分层)会以1GB71 为增量,将数据从高性能层分到高容量驱动器层中,这样整体成本较低,而且不用考虑应用程序类型或数据过期问题。而最令人称道的是,这一切都是基于客户定义的策略自动发生的,通过智能地执行与任务资源调配前后关联的工作,大大节省了应用程序和存储管理员的时间与费用。通过自动化更高效地使用存储容量VNX系列包含内置的功能,有助于确保冗余、非活动或预期数据不占用宝贵的存储资源。数据块压缩功能(旨在处理相对不活动的LUN,例如备份副本和静态数据存储库)会自动压缩数据,使客户可以重新捕获容量,并将数据的占用空间减少高达50%。文件级重复数据消除/压缩功能通过对非活动文件进行有选择地压缩和重复数据消除,从而可将所使用的磁盘空间减少高达50%。因为这些功能是作为后台任务运行的,所以可将系统性能开销降至最低。适合虚拟环境的最佳存储VNX系列是适合虚拟化应用程序环境的理想中端系统。无论客户环境是基于VMware、MicrosoftHyper-V还是基于Xen,VNX都可通过所有支持协议的完全认证,确保在实施的所有阶段都能够成功地部署虚拟化基础架构。这样存储和服务器管理员就不会再盲目地执行操作。通过VAAI(用于阵列集成的vStorageAPIs)将Unisphere与VMwarevCenter™紧密集成,管理员可洞悉整个环境的情况(端到端)。每个人都可以使用其熟悉的管理界面查看虚拟资源和物理资源,透明地对存储进行资源调配、集成复制、访问所有存储功能并将其卸载到阵列上。l只要单击两下,便可通过VMwarevCenter对存储进行资源调配。l针对VMware的EMCVNX插件利用最佳做法可确保存储与VMware之间获得最佳l利用率和恢复能力。l可加速硬件的Fast克隆能够在数秒内快速对新虚拟机进行资源调配。71 l针对NFS数据存储区的按需VMDK压缩功能可将存储消耗量减少高达50%。l与VMware联合开发的EMCProven™解决方案和参考体系结构可加快关键应用程l序虚拟化的速度。业内最齐全的存储软件产品VNX系列软件以两种综合性程序包的方式提供,可确保客户拥有保护和管理其信息的所有必需功能。VNXTotalProtectionPack包括复制功能、时间点恢复功能(例如快照和克隆与自动应用程序复制结合使用可确保恢复)以及与保护策略法规遵从性相关的监控和警报。VNXTotalEfficiencyPack包含所有保护功能以及“一次设置、永久使用”性能优化功能。所有VNX软件都可通过Unisphere进行管理。lVNX软件还可以通过以下模块化套件获得:lFASTSuite—自动优化,可获得最高的系统性能,同时可将存储成本降至最低。lSecurityandComplianceSuite—保持数据安全,免受更改、删除和恶意活动的l影响。lLocalProtectionSuite—执行安全数据保护和重新调整用途lRemoteProtectionSuite—保护数据免受本地故障、停机和灾难的影响lApplicationProtectionSuite—自动执行应用程序复制并证明法规遵从性持续可用性保持业务正常运营VNX系列设计为可在关键业务环境中提供“5个9”的可用性。VNX可用性和冗余功能包括:71 l高达12.8GB的镜像写缓存,在镜像写缓存中,每个存储处理器都同时包含LUN的主缓存数据及其对等存储处理器的缓存的辅助拷贝l备用电池能够在出现电源故障时按顺序执行关机,缓存会转储到存储区磁盘,以确保数据得到保护lRAID保护级别0、1、1/0、3、5和6,所有这些级别都可以同时并存于同一阵列中,以适应不同的保护要求l主动热备盘增强了系统稳定性并提供最大的可靠性和可用性l冗余数据路径、电源、驱动器连接和存储处理器,所有这些都具备无中断现场更换能力l提供持续的系统监控、呼叫总部通知和高级远程诊断功能利用EMC全球服务充分发挥VNX系列的优势EMC为各类企业提供解决其业务和IT难题并加快私有云进程所需的战略指导和技术专业技能。我们有遍及世界各地的14,000多名服务专业人员和支持专家,并有一个全球性联盟和合作伙伴网络,他们利用EMC三十年来在以信息为中心的业务实践中取得的经验证的方法体系、行业最佳做法、经验和知识,满足客户在整个信息生命周期中的全部需求。所有EMCVNX平台都包含三年期“增强”支持保修,向客户提供下一工作日现场服务以及全天候远程支持。客户可以升级到“特优”支持,以获得全天候当天现场支持。VNX软件保修包括90天的缺陷介质更换。客户可以升级到“基本”、“增强”或“特优”软件维护支持,以满足其IT要求。EMC针对VNX系列提供一整套补充服务,确保在客户环境中实现预期的性能。专家规划、设计和实施服务有助于缩短投资回报时间。EMC咨询服务还帮助客户制定存储战略,为实施虚拟化和私有云做好准备。EMC教育服务通过一套全面的业界领先的技术培训和EMC经验证的专家认证进一步提高客户投资的价值。EMC还是数据迁移服务领域的领头人,通过使用一流的自动化工具实施发现、补救、规划和设计,每月可迁移超过1PT的数据。EMC客户服务因其卓越的任务关键型支持而六次荣获SSPASTAR奖—可以帮助组织保持信息全天候可用,以提供竞争优势并带来收入增长。71 71 71'