华为云盘算之容灾技术

张裕  高级会员 | 2024-7-31 14:46:06 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 212|帖子 212|积分 636


  • 容灾是物理上的容错技术,不是逻辑上的容错
  

  • 同步长途复制:主备间隔≤200km,只有在主备设备上都写成功,才会告诉主机写成功,不会丢失数据
  

  • 异步长途复制:主备间隔>200km,只要主设备上写成功,就会告诉主机写成功,等候一个周期后,才会在备设备上写一个周期之前的数据,会丢失一个周期的数据
  容灾和备份

  

  • 容灾
  

  • 在相隔较远的异地,创建两套或多套功能相同的IT体系,相互之间可以举行健康状态监督和功能切换,当一处体系因意停止工作时,整个应用体系可以切换到另一处,使得该体系功能可以继承正常工作
  

  • 容灾是包管业务的连续性,是业务级别的
  

  • 备份
  

  • 是容灾的基础,在数据中心内,将全部或部分数据集合从应用主机的硬盘或阵列复制到其他的存储介质的过程
  

  • 备份是包管数据可用,是数据级别的
  

  • 容灾是指不在同一机房的数据或应用体系备份,备份是指本地的数据或体系备份
  容灾的指标

              
           

  • 数据恢复时间点(RPO)
  

  • 以数据为出发点
  

  • 能够容忍的数据丢失量
  

  • 应用恢复时间(RTO)
  

  • 以应用为出发点
  

  • 能够容忍的应用体系恢复时间段
  灾备体系的创建标准

  

  • 灾备是指将容灾和备份结合,本地备份结合长途数据复制实现完善的数据掩护
              
           

  • 体系容灾级别
  

  • 1级:本地备份,每周至少做一次完全数据备份
  

  • 2级:实现异地备份
  

  • 3级:异地备份+热备份中心
  

  • 4级:在线数据恢复
  

  • 5级:活动状态的备份中心
  

  • 6级:实时数据备份,长途数据实时备份,实现零丢失
  

  • 7级:零数据丢失,主动接受业务
  容灾解决方案

  

  • 本地备份
  

  • 通过高可用冗余设备实现备份,只能解决体系内的单点故障、软件逻辑错误等机房内的事件
  

  • 同城灾备
  

  • 通过同城的两个数据中心实现备份,如果发生火灾、地动、大水等则无法解决
  

  • 异地备份(两地三中心)
   
  

  • 区域性劫难,例如地动、大规模生齿疏散等
  华为备份解决方案

  

  • 一体化备份
  

  • 数据量<36TB,开机即用,批量复制,被集成
  

  • Simpana/AnyBackup,只能实现物理机的备份
  

  • 虚拟化备份
  

  • eBackup,只能实现虚拟机的备份
  

  • 会合备份
  

  • 数据量>36TB,主攻大颗粒数据中心备份项目
  

  • 将各个分公司(节点)的数据汇总到总公司举行备份
  

  • 本地容灾解决方案
  

  • 可以使用多台路由器、交换机、电源等
  

  • 同城容灾解决方案
  

  • 主备
  

  • 同步长途复制:RTO≠0,RPO=0。两个数据中心间隔≤200km
  

  • 异步长途复制:RTO≠0,RPO≠0。两个数据中心间隔>200km
  

  • 双活:RTO=0,RPO=0。两个数据中心间隔≤100km,生产环境中<80km。
  

  • 备数据中心中和主数据中心相同,也有交换机和服务器,但是不会开机,只有底层的存储会开机,用于同步主设备的存储中的数据,当主设备发生故障时,从设备会立马将交换机、服务器开机,连接底层的存储,将业务拉活
  

  • 异地容灾解决方案
  

  • 两地三中心
  

  • 同城的两个数据中心之间可以采用双活或同步长途复制,与异地的数据中心之间只能使用异步长途复制,成本较高
  

  • DC1->DC2->DC3:级联
  

  • DC1->DC2,DC1->DC3:并联
  

  • 级联时,DC1压力小,但是不安全,当DC2出现故障,DC3无法掩护DC1
  

  • 并联时,DC1压力大,但是DC3可以掩护DC1和DC2
  

  • 主备:两个数据中心之间采用异步长途复制,会存在一个周期的数据丢失,成本较低
  

  • 有容灾也须要做备份。因为如果主设备发生数据的修改或删除,备设备会同步举行修改或删除。为了防止主设备上的数据被恶意删除,所以还须要做本地或异地的备份
  

  • 有备份也须要做容灾。因为如果发生劫难,只做备份,那么会丢失更多的数据,而且会造成业务停止时间过长,丧失过大。做好容灾,可以减少业务数据的丢失,并且可以在很快的时间内将业务拉活
  本地高可用方案

              
           

  • 可以使用同步长途复制或双活
  

  • 使用同步长途复制时,当出现故障时,须要人工手动扫描底层的LUN,挂载到服务器上,拉活业务
  

  • 使用双活时,当出现故障,会主动扫描LUN,并挂载使用,拉活业务
  

  • 实现业务级高可靠、业务0停止、数据0丢失
  主备容灾方案

              
           

  • 双活须要在两个LUN之间做双活,可以实现
  

  • 真双活:6层双活架构,业务级双活,业务0停止,数据0丢失
  

  • 高性能:HyperMetro性能提拔30%
  

  • 可视化:全局拓扑、会合告警,故障主动切换、恢复
  

  • 长途复制要在两个LUN之间做同步/异步长途复制,可以实现
  

  • 秒级RPO:基于内存时间片的数据复制功能,RPO≈0
  

  • TCO低:存储高中低端互通,异构、利旧
  

  • 可视化:全局拓扑、会合告警,主动化,一键式容灾演练、恢复
  两地三中心容灾方案

              
           

  • 可以实现
  

  • 高可靠:3份数据,容灾范围更大
  

  • 平滑扩展:同城平滑扩展到两地三中心,级联、并联机动部署,高中低端互通复制
  

  • 可视化
  
  <blockquote class="kdocs-blockquote" style="text-align:left;">   以上内容均属原创,如有不详或错误,敬请指出。   
本文作者: 坏坏

  
本文链接:http://t.csdn.cn/YuC81

  
版权声明: 本博客所有文章转载请联系作者注明出处并附带本文链接!


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

张裕

高级会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表