可靠性(Reliability)
是软件体系在应用或体系错误面前,在意外或错误利用的情况下维持软件体系的功能特性的根本能力。
可靠性是最重要的软件特性,通常用来衡量在规定的条件和时间内,软件完成规定功能的能力。可靠性通常用均匀失效等候时间 (Mean Time To Failure,MTTF) 和均匀失效间隔时间 (Mean Time Between Failure,MTBF) 来衡量。在失服从为常数和修复时间很短的情况下, MTTF 和 MTBF险些相等。
可靠性可以分为两个方面:
1)容错:错误发生时确保体系正确的行为,并举行内部“修复”。
2)结实性:错误发生时保证软件按照某种已经定义好的方式制止执行。
设战略略:心跳、Ping/Echo、冗余、推选。