星载嵌入式计算机系统可靠性技术研究

时间:2022-05-08 02:09:32

星载嵌入式计算机系统可靠性技术研究

摘 要:随着我国经济的不断发展,我国的航天事业也得到了飞速的发展,因此就需要在可靠性能方面进行全面地改善,星载嵌入式计算机的性能、体型以及可靠性等。星载嵌入式计算机的可靠性直接关系到卫星的使用寿命,目前我国的星载计算机系统的可靠性技术尚存在诸多不足,这成为发展长寿命卫星的“绊脚石”。本文在空间环境和星载计算机抗辐射的角度研究了其可靠性,建立了马尔可夫可靠性模型,在此基础上进一步探讨了星载计算机的并行性能。

关键词:星载计算机;系统可靠性;马尔科夫可靠性模型

中图分类号:TP302 文献标识码:A

星载计算机系统是卫星的核心系统之一,主要功能是在恶劣的空间条件下对复杂的卫星综合电子系统进行信息处理,包括对信息进行采集、处理、分配和存储。所以星载计算机系统对于硬件的可靠性有极高的要求,此外,应最大限度地避免其出现故障和延长其使用寿命。因此,研究星载计算机系统的高可靠性设计是当下刻不容缓和势在必行的任务。本文研究的星载并行计算机是基于上述目标设计研发的高可靠性星载嵌入式计算机系统。

一、当前我国星载嵌入式计算机系统可靠性存在的不足

(一)起步晚,技术不成熟

我国星载嵌入式计算机技术的起步相比其他发达国家比较晚,但是我国的星载嵌入式的计算机技术已经取得了非常可观的发展,比如小型化以及高性能方面;并且随着科学技术的不断发展,对于嵌入式计算的需求和要求也变得越来越高,需要系统在可靠性方面必须具备相当可观的可靠性,在此种情况下,我国在技术方面很大程度上存在着相当大的缺陷和漏洞。因此为了充分保证系统的可靠性,就需要对星载计算机体积和质量尽可能地减少。

(二)软件编程往往无法达到既定要求

在对星载嵌入式计算机系统软件进行编程的过程中,在很大一部分会出现系统可靠性能下降的现象,这种现象是由于在软件系统的编程过程当中没有达到既定的要求造成的,在此种情况下就需要对星载嵌入式的计算系统当中的软件编程系统进行可靠性能方面的确定。

(三)使用寿命短

在进行星载嵌入式计算机系统的建造过程当中,需要对计算机系统的整体性进行充分的设计和满足,集中体现在计算机的大规模集成电路性能方面。在现阶段当中,一般情况下导致星载嵌入式计算机系统的使用期限不满足设计要求的原因是由于星载计算机系统本身的可靠性指标造成的。

二、关于星载并行计算机体系结构的设计要求

在星载嵌入式计算机系统的运行过程中,需要在相当严格的条件下进行工作,在此种情况下,空间中的环境和地面当中的环境对于星载嵌入式计算机系统结构的设计方面造成不同程度的影响,集中体现在可靠性、抗辐射性能以及低功耗性这3个方面来进行分析。

在可靠性方面,计算机系统可靠性分为固有可靠性和使用可靠性两个方面的内容,前者在计算机系统设计和制造的过程中确定,其设定远高于地面的可靠性指标;后者受设计制造和使用条件的影响。为了保证星载嵌入式计算机本身的稳定性能在一定程度上保持相对大的稳定性能,就需要对星载嵌入式的设计结构体系方面进行全面提升,比如系统、部件、逻辑设计、电路板以及电器元件等各方面。

在抗辐射性方面,由于本星载嵌入式系统本身固有的特殊环境,在其空间环境当中的存在的大量辐射性的物质在很大程度上就会形成星载嵌入式计算机系统当中的不稳定因素,比如空间环境当中的高能质子、中子、α粒子以及重离子等都会对半导体器件发生单粒子效应以及总辐射计的剂量反映,从而对其可靠性和寿命造成一定程度的影响。

在低功耗性能方面,随着星载嵌入式计算机技术的不断发展,对于系统方面的功能要求也变得越来越多。在此种情况下,就会对星载嵌入式计算的系统在真空散热方面的问题进行专项研究。如果计算机系统当中的散热性能在不好的情况下,对于系统造成的功能性损耗也就会越来越大,从而影响系统的正常运行,导致计算机系统的异常工作现象。除此之外,在星载嵌入式计算机系统中,主要的能量来源为太阳能蓄电池提供的能量来进行运行工作,一般情况下太阳能蓄电池的续航时间是有一定限制的,需要在一定的时间内为系统提供必要的能量,因此就需要对系统进行低功耗的设计,从而达到满足计算机系统可靠性的同时保证电能的有限续航时间。

三、马尔可夫模型及分析

马尔可夫链是一种无后效性的离散状态随机过程。用连续时间马尔可夫链(CTMC)对计算机系统的可靠性进行建模,可以表示出系统中复杂的失效依赖关系。在星载计算机可靠性分析中,为了更为准确地体现双CPU并行/双机冷备份的容错结构,本文建立了该系统的CTMC可靠性模型,并对其求解并对结果进行分析。

(一)马尔科夫模型的建立

在星载并行计算机体系结构以及双CPU并行双机冷备份容错设计中,如果在使用的过程中出现乙机且乙机无法降级使用的情况,就属于系统出现的故障现象。在这种情况下,就需要对系统的关键部件进行充分分析,对关键部位的工作时间进行指数的测定。如果在系统故障之前,关键部位的状态呈现出指数分布的状态,则CPU部件在启动时和正常工作时的平均失效率分别为λ1和λ3,降级使用时的平均失效率为λ5;如果桥接器的部件在启动的时候平均失效率为λ2,在正常工作的时候平均失效率为λ4,那么在系统其它部分失效不考虑的情况下,就需要进行对模型进行建立。

用图1所示的CTMC模型表示星载双CPU并行/双机冷备份系统的行为模型,图中每个状态采用五元组Z={p,q;r,s;t}进行标识。

各个分量的含义是:

p代表甲机可用CPU的个数;

q代表甲机可用桥接器的个数;

r代表乙机可用CPU的个数;

s代表乙机可用桥接器的个数;

t用以区别系统的不同状态。

(二)马尔科夫模型的求解

如果用{Z(t),t≥0}来表示状态空间为Ω的连续参数齐次马尔可夫链,则无穷小生成矩阵Q=[qij]就代表从状态i到状态j的转移概率,其对角元素qii=-qi= -∑j≠iqij.对图1中模型的状态从左至右排序,状态空间Ω={1,2,…,14},则Q矩阵为图1所示。

(三)模型求解结果和分析

在实际的工作当中,元器件的失效率会出现升高的现象,因此就需要进行对比计算,见表1。

从表1中可以得出,在启动失效率相同的情况下,第1,3,4组中CPU(桥接器)的工作失效率λ3(λ4)分别为启动失效率λ1(λ2)的10倍、20倍、5倍;在系统升级之后,CPU的工作失效率λ5均为正常工作时失效率λ3的2倍,从而可以对计算机系统模型的可用度进行充分计算,结果如图2所示。

从图2中可以看出,部件启动的失效率在第一组和第二组当中的参数曲线差别是很小的,证明了部件的失效率对于系统的可用度是相对较小的。在第三组当中的参数系统可用度要比第一组、第二组以及第四组的曲线参数要低。在图2中的第四组参数是最高的,表示在系统运行的前10年之内系统使用的下降速度是很缓慢的。

四、分析与展望

星载嵌入式计算机的可靠性在受到自身的因素制约之外,处理的效率也是其中主要的制约因素之一。在此种情况下,就需要对星载嵌入式计算机系统的可靠性能进行充分地设计,以此来适应复杂多变的航天航空的任务要求。在星载并行计算机系统的设计过程中,需要以体系结构为主要出发点,来实现对并行处理结构的提升,从而对现有的机构性能和可靠性进行全方位地提升。此外,在现有研究成果的基础上,我们可以在下述方面展开进一步地工作:

首先在计算系统的可靠性能方面,需要依靠模型来进行抽象系统的研究,在对系统的行为和特点在进行运行过程中,需要对模型中的许多特点来进行充分研究,比如复杂的计算机、通信系统的诸如容错、动态重构修复、资源竞争、并发与同步、任务死锁、缓慢降级等。在进行星载嵌入式计算机的性能模型进行确定的时候,可以利用层次建模的方式来进行实现。

其次,在对复杂的系统性可靠性建模的发展过程中,需要不断地进行创新理论,在现阶段当中已经有云模型理论、基于自然语言描述的可靠性建模、基于小子样检测的可靠性建模等多种模型理论。由此可见,在对模型进行研究的时候需要对模型的生成和求解的技术进行充分研究,以此来将其应用到星载嵌入式计算机系统的研发过程中,从而有效提升计算机系统的可靠性能。

结语

目前,在我国的星载嵌入式计算机技术当中已经取得了一定程度的进步,值得注意的是仍然存在着很大程度的缺陷和漏洞,因此就需要科研人员来对自身的专业素质进行不断地提升,并且在提升的过程中还需要将现有的技术来进行充分结合,以此在有效提升星载嵌入式计算机系统的可靠性能的同时,还要努力研发长寿命的星载嵌入式计算机,以延长卫星的使用寿命,为航空航天事业的发展做出积极贡献。

参考文献

[1]陆大n.随机过程及其应用[M].北京:清华大学出版社,1986.

[2]宋远骏.复杂系统可靠性建模与评价方法[D].哈尔滨:哈尔滨工业大学,2001.

上一篇:网络经济时代电力营销策略探讨 下一篇:出院后产后抑郁筛查及访视干预对产妇产后抑郁...