计算机系统的可靠性是制从它开始运行(t=0)到某时刻t这段时间内能正常运行的概率,用R(t)表示。
失效率是指单位时间内失效的元件数与元件总数的比例,以λ表示,当λ为常数时,可靠性与失效率的关系为: R(t)=е^(-λt)。
系统类型 | 可靠性 | 失效率 |
串联系统 | R=R1×R2×...×Rn | λ=λ1+λ2+...+λn |
并联系统 | R=1-(1-R1)×(1-R2)×...×(1-Rn) | |
模冗余系统 | |
1)串联系统:假设一个系统由n个子系统组成,当且仅当所有的子系统都有能正常工作时,系统才能正常工作,这种系统称为串联系统
设系统各个子系统的可靠性分别用R1, R2, R3……, Rn表示,则系统的可靠性
R=R1×R2×R3×……×Rn
如果系统的各个子系统的失效率分别用λ1, λ2, λ3……, λn来表示,则系统的失效率
λ=λ1+λ2+λ3+……+λn
则系统平均故障间隔时间为:
MTBF=1/λ
假设本题三个子系统是串联的,n=3,R1=R2=R3=0.9,λ1=λ2=λ3=1/10000=0.0001,则:
系统可靠性 R= R1×R2×R3=0.9×0.9×0.9=0.729
系统失效率 λ=λ1+λ2+λ3=0.0001+0.0001+0.0001=0.0003
系统平均故障间隔时间 MTBF=1/0.0003=3333
(2)并联系统:假如一个系统由n个子系统组成,只要有一个子系统能够正常工作,系统就能正常工作。
设系统各个子系统的可靠性分别用R1, R2, R3……, Rn表示,则系统的可靠性
R=1-(1-R1)×(1-R2)×(1-R3)×……×(1-Rn)
如果系统的各个子系统的失效率均为λ,则系统的失效率μ为
则系统平均故障间隔时间为:
MTBF= 1/μ
根据本题题意可知,n=3,R1=R2=R3=0.9,λ1=λ2=λ3=1/10000=0.0001,则:
系统可靠性 R = (1-R1)×(1-R2)×(1-R3)=1-(1-0.9)×(1-0.9)×(1-0.9)=0.999
系统失效率 μ = 1/((1/0.0001)*(1/1+1/2+1/3))=6/(10000*11)
系统平均故障间隔时间 MTBF=10000*11/6=18333
软件可靠性的X个9
X个9表示在软件系统1年时间的使用过程中,系统可以正常使用时间与总时间(1年)之比,一般都是3~5。
- 3个9:(1-99.9%)*365*24=8.76小时,表示该软件系统在连续运行1年时间里最多可能的业务中断时间是8.76小时。
- 4个9:(1-99.99%)*365*24=0.876小时=52.6分钟,表示该软件系统在连续运行1年时间里最多可能的业务中断时间是52.6分钟。
- 5个9:(1-99.999%)*365*24*60=5.26分钟,表示该软件系统在连续运行1年时间里最多可能的业务中断时间是5.26分钟。
那么X个9里的X只代表数字3~5,为什么没有1~2,也没有大于6的呢?我们接着往下计算:
- 1个9:(1-90%)*365=36.5天
- 2个9:(1-99%)*365=3.65天
- 6个9:(1-99.9999%)*365*24*60*60=31秒
可以看到1个9和、2个9分别表示一年时间内业务可能中断的时间是36.5天、3.65天,这种级别的可靠性或许还不配使用“可靠性”这个词;而6个9则表示一年内业务中断时间最多是31秒,那么这个级别的可靠性并非实现不了,而是要做到从5个9》6个9的可靠性提升的话,后者需要付出比前者几倍的成本,所以在企业里大家都只谈(3~5)个9。