论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
软件与程序人生
›
云原生
›
《分布式技术原理与算法解析》学习笔记Day28 ...
《分布式技术原理与算法解析》学习笔记Day28
铁佛
论坛元老
|
2023-3-3 07:25:38
|
显示全部楼层
|
阅读模式
楼主
主题
1913
|
帖子
1913
|
积分
5739
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
故障恢复
我们之前讲过故障隔离,它的目的是对故障组件进行隔离,以避免影响系统中的其他组件,尽可能保证分布式系统的可用性。
但是之后故障隔离还不够,我们需要考虑进行故障恢复。
什么是分布式故障?
分布式系统中的故障,可以分为两类:
物理故障,例如硬盘损坏、断电断网等。
软件故障,例如系统中存在的bug导致系统崩溃、负载过高等。
我们可以对故障进行分类讨论,包括:
节点故障,可以分为硬件故障和软件故障两种,主要表现是机器无法为用户提供服务。
网络故障,节点间无法通信,从而影响分布式应用正常提供服务。
什么是故障检测和恢复?
故障检测,是指通过一定的方式识别或者发现故障。
在分布式系统中,检测硬件故障通常会比较复杂,因此是通过查看软件层的表现结果进行故障检测。
故障检测,通过一定方式来识别或者发现故障。
在分布式系统中,检测硬件故障通常比较麻烦因此会通过软件层的表现结果进行故障检测。
故障恢复,是指修复分布式系统中出现的故障,使系统恢复正常。
在分布式系统中,常见的故障检测方法就是心跳机制,我们可以把它分为两类:
固定心跳检测策略
根据历史心跳信息预测故障检测策略
故障恢复策略
对于单点故障问题,往往采取主备策略,即当主节点故障后,从备节点中选出一个作为新的主节点。以继续提供服务。
对于网络故障问题的解决方案,简单来说就是C、A、P选择的问题。
当分布式系统中出现网络故障时,对于高可用性要求严格的系统,会要求必须及时响应用户的场景,就需要保AP放弃C的策略,对于数据一致性有严格要求的系统,就需要保CP放弃A的策略。
网络恢复问题也可以看做是数据恢复问题,即网络故障恢复之后节点之间数据进行同步的问题。
出处:
http://wing011203.cnblogs.com/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
铁佛
论坛元老
这个人很懒什么都没写!
楼主热帖
Visual Studio 2022 安装低版本的 .Net ...
R语言使用dplyr包的arrange函数对dataf ...
Apifox:节省研发团队的每一分钟 ...
手把手教你入门Python中的Web开发框架 ...
身为一个测试工程师只会点点点?我劝您 ...
通过cookie和localstorage实现数据持久 ...
.net6下使用DotnetZip解压文件,中文出 ...
实现华为多屏协同--非华为电脑下载12.0 ...
.Net Core 5.x Api开发笔记 -- Swagger ...
反射(一)-常用方法及加载资源文件 ...
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
前端开发
Mysql
人工智能
快速回复
返回顶部
返回列表