无线通信系统的环境适应性

时间:2022-08-14 07:55:46

无线通信系统的环境适应性

摘要:无线通信基站系统在现场应用中会受到散热、灰尘、油烟、湿度、腐蚀等环境因素的影响,而运营商降低建设成本和维护成本的考虑使得设备工作环境更加恶化。从实践角度出发,基于实际部署经验,系统性地分析了上述因素对设备可靠性的影响,提出综合设备设计和应用环节统筹考虑以减轻影响的思路,并针对设备设计和部署给出了具体建议。

关键词:无线通信;环境适应性;热设计;腐蚀;灰尘

Abstract: Environmental factors such as radiation, dust, lampblack, and corrosion affect wireless base station systems. With decreased capex and opex, there is a risk that the environment in which equipment operates deteriorates. In this paper, we draw on actual experiences in the field to discuss the effect of environmental factors on base station reliability. We suggest that environmental factors should be taken into consideration when designing network equipment, and we make specific recommendations about how equipment should be designed and deployed.

Key words: wireless communications; environmental adaptability; thermal design; corrosion; dust

运营商降低TCO,主要包含降低建设成本(CAPEX)和维护成本(OPEX)两方面。为了降低CAPEX,通信设备尤其是接入网设备的工作环境,从机房、空调方舱等被改变为包括室外柜、弱电井、楼道、车库、铁皮柜等各种复杂环境,同时对通信设备提出了体积小、重量轻、安装成本低的要求,还要维持设备本身的低成本;为了降低OPEX,设备要尽量降低功耗、尽可能地被室外化、工作环境相对过去高温化,以节省电费,同时还要求设备尽量减少维护,以降低维护人工的成本。接入网电信设备从精密、娇贵的设备,已经变成无所不在的IT化设备,甚至工作环境更为恶劣。简易机房土坯墙面脱落,设备工作环境的恶劣情况如图1所示。

在这个背景之下,电信设备近年来面临各种新的环境适应性问题,设备设计的一些思路也需要有发生转变,从遵从标准到理解标准,满足应用场景,以适应不同的应用需求。

对设备在不同环境下工作以及设计约束的研究,传统上属于可靠性方面。但是,传统的可靠性方法,并没有针对实际工程应用给出足够的指导意见。设备设计制造需要对环境适应力的深入理解和把握,以及从系统多个维度上进行平衡。

1 研发过程的可靠性方法

传统的可靠性增长方法,主要从可靠性预计和可靠性指标分配开始,通过预算、设计、控制等过程,保证产品的质量[1]。

可靠性预计基于对器件失效模型的认识,通过概率与数理统计方法,首先对系统建立可靠性数学模型,然后评估其平均无故障时间(MTBF)、平均恢复前时间(MTTR)等指标。参照的方法很多来源于美国军用手册MIL-HDBK-217。但是,这些方法在实际应用中有非常大的局限性,存在估算数据不准确,参考意义不足等诸多问题[2-3]。

有一些人认为,这些方法估计不准确的主要原因是在于手册制订时间过早,电子工业经过多年的发展,手册不符合实际的情况,有一些通过经验进行修正尽量使得估计准确。但是仍然有很多因素使得估算不能准确进行:一个主要因素是失效模型受到诸多外界因素的影响,故障往往都不是模型中考虑的,多为过应力使用、非设计场景的恶劣环境等,无法在模型里考虑充分;另外一个主要因素是系统模型异常复杂,实际的分析不可行。

以目前通信基站系统来看,一个系统中存在若干个单板,有一些故障模式并不能完全用串联或者并联描述,存在关联性。每个单板中可能存在超过100~200种、数千个物料,存在多种失效模式。失效模式、失效模式对应的器件范围,甚至一种失效模式在不同的情况下对系统的影响均不相同。这样,使得可靠性预计更加困难,难以有效实施。而且,随着IT化和商用货架产品(COTS)的广泛使用,可靠性分析对设计的指导作用更加有限。从设备设计和生产实际的经验认为,主要的设备故障和异常往往来自于环境等外部不可控因素影响,而不是部件自身老化或者偶发失效,这也使得可靠性预计的准确度大大降低。

有一些更激进的观点认为,可靠性预计已经变成数字游戏,对产品的质量和设计没有指导意义。能够保证设计系统可靠的是可靠性增长试验和失效物理(可靠性筛选和监控属于控制范畴,本文不讨论)。

失效物理通过研究某一种因素对部件的影响,分析部件会在何时、何处、何种原因,发生何种类型的失效。通过研究扩散、相变、腐蚀、应力、静电泄放等物理化学过程对器件的影响,来分析器件可能产生的问题。失效物理的分析为进一步的改进和增加可靠性提供了很好的基础(分析的例子如图2所示)。

目前可靠性增长试验中,应用较为广泛的包括四角测试、强加速寿命试验(HALT)等,还包括盐雾、灰尘、湿尘、振动、渗漏等。这些试验有意无意地采用失效物理分析的一些因素,例如HALT实际上考虑的是高低温应力、高低温循环带来的应力、叠加强振动等,来寻找系统设计的薄弱环节;盐雾考虑的是腐蚀的问题;振动主要评估结构在应力下的表现。因为设备寿命远远长于试验所能够接受的周期,在可靠性试验设计中,常常也采用加速的方法,加大应力(电压、温度、湿度、温变速率等),增加样本数量,来评估系统实际工作中的寿命。图3就是室内无线基站设备的加强灰尘试验,评估极端灰尘环境对设备连接可靠性和散热的影响。这些试验对改进设计、提高实际应用的可靠性起到了很大的作用,也是设计中保证设计指标的必要手段。但是为了控制分析的复杂度,试验剖面设计一般只针对某一类应力、机理或者失效模式,和现场应用的复杂环境有所区别。

系统设计上,要综合考虑可靠性方法、电路设计方法、结构设计、环境设计方法等,结合降低CAPEX和OPEX的要求,确保设备的可用性。

2 设备常面临的环境问题

设备工作的环境情况非常复杂。北大西洋公约组织将全球的气候根据温度和湿度作了划分,作为设计指导的依据[4]。温度和湿度对设备存在一定的影响,但是设备的工作和更多的环境因素、人为操作因素相关联。美国军用标准MIL-HDBK-338B第7部分,对环境因素和对设备的影响进行了一些描述,但是也没有给出设计指导意见[5]。

因为环境对设备的影响相互关联,很难独立的进行分析。本文尽量将关联的因素进行归类,分析对设备带来的影响以及设计应用中需要进行的考虑。

2.1 散热及相关

温度对设备有很多方面的影响,与散热相关的设计是设备最关注的方向之一,并且和包括灰尘等方向相关联。

从可靠性角度来看,温度影响着器件内粒子的扩散速度,过高的温度会加速迁移的速率,最终导致器件的失效。同时,温度还会加速腐蚀的进行。温度的昼夜、季节变化导致设备各个部件的热胀冷缩。热胀冷缩率的不同,对器件封装、组装等各个环节产生循环的应力。温度对设备寿命的影响在可靠性分析中已经有很多的研究,一般认为,温度每升高10度,设备的寿命缩短为原来一半。

从可靠性预计角度来看,为了延长设备寿命,应该使设备保持较低的温升。实际上,为了满足日益增长的处理复杂度需要,设备的集成度持续提升,设备比以往要耗散更多的电力。要把这些热散出去,需要增加设备的体积,或者增加设备的风流量,增加辅助的散热设施。这些措施的采用,直接抬高了CAPEX;降低设备温度,还意味着风扇/空调的转速更高,作为运动部件的风扇,比电子零部件更容易失效,这也就意味着降低温度实际使得设备更容易失效;更大的风流量,也意味着防尘网需要更频繁的清洗,增加了人力维护成本;更大的风流量,还意味着更多的耗电、更大的噪音。作为设计折中,系统设计中,比较倾向于让器件的工作温度在保证降额的情况下,贴近高温区,减少散热带来的电费增加以及风扇磨损、噪音等相关问题。不但如此,系统设计中让设备工作温度靠近高温区,还可以降低设备内湿度。但是,贴近高温区,也可能使半导体器件漏电导致设备消耗更多能量,需要平衡各因素进行考虑。

一般设备设计上已经考虑使得零部件在设计寿命内工作处于浴盆曲线的底部,在设计范围内工作时温度并不是设备发生故障的主要原因。设备损坏主要的原因常常来自于一些不可控制因素,使得工作环境超过设计能够支持的极限温度。从功能性能角度来看,温度会影响数字逻辑器件的工作频率,使得设计裕度被打破而导致功能异常;有的器件,例如恒温晶体振荡器(OCXO)内部具有加热恒温槽,在外部温度低于内部温度下才能起到恒温的作用,当温度范围超出标准时,时钟保持性能可能受到严重影响。这些都还是可恢复的异常。在更恶劣的情况下,芯片的漏电流随着温度升高以指数方式增大,在额定温度点附近功耗随温度快速增加,反过来带动芯片的温度进一步增加而导致热失效;高温下焊点、机械结构可能由于蠕变而失去强度;PCB板可能发生碳化、分层等失效[6]。

设备设计上更关注的是如何使得这些外部的异常更不容易发生,异常发生的时候系统如何自动保护,同时兼顾越来越精细的OPEX优化考虑。第一,对工作的环境提出了更明确的要求,根据实际的气候、业务模型等条件,把设备的工作环境作为一个系统来进行指标分配设计及综合成本评估,而不是只关注设备本身;第二,当服务质量许可的情况下,当出现异常状况时,系统通过自动降低负荷,甚至局部断电的方式进行自我保护,在异常解除时恢复工作,增强实际的可用性和可靠性。

随着多年的扩容、2G向3G换代以及多网多制式的共存,单个站点的容量密度也远高于过去。没有重新设计的机房或方舱,可能对设备的工作环境带来较大的影响。文献[7]给出了机房换气设计的要求。如果机房达不到要求,则会导致设备过温。在实际应用中,因为空调设备被盗、损坏,通风装置损坏或者过滤网被堵塞等情况经常出现。有的站点建设时间较早,容量很低,经过长期运行通风设施存在问题。存在问题的设施如图4所示。当进行更换扩容后,这样的站点经常频繁出现高温告警。

设备散热设计通过仿真、测试验证的方法在行业内已经广泛使用。通信设备内部相对环境均存在一定的温升,基本不存在除设备本身发热之外的其他热负荷,所产生的热量基本属于显热,主要通过强制对流进行散热,这样使得我们在考虑散热的计算时候相对较为简单。在保持对流空气温升一定的情况下,单位功耗需要的空气流量是一定的。这个是设备设计的物理限制,无法突破。散热需要的空气体积可用如下公式计算:L = Qs/(Cp×ρ×ΔT),其中L为空气的体积,Qs为显热,Cp为空气的平均比定压热容,在设备的工作范围内,可以认为是一个常量,ρ为空气的比重。假设设备设计最高工作环境温度为55℃,允许出风口空气温度为65℃,温升10℃,系统热负荷为700 W,则系统一个小时需要的风量约为200 m2。

这只是一个指导性的结果,不能替代系统内部的热设计,但是综合考虑设备风速、通风口面积等设计,如果不能达到这样的风量,则只能降低设备的热负荷,增加允许的系统温升,或者采用其他补充的散热方式来满足散热要求。

在高海拔区域,因为气压下降,风冷的效果会受到进一步的影响。但是高原地区一般也不会出现高温等环境,设备的散热环境并不会将最差因素叠加。在整个热系统设计中,可以根据实际情况,做出成本优化又能保证可靠性的设计。

综上所述,散热的设计不仅仅涉及到器件的可靠性,而是要考虑整个系统的工作模式以及降低CAPEX、OPEX的需求,结合设备外运行环境如噪声要求等协同解决,在各种相互矛盾的限定因素中平衡优化。在空间受限、集成密度高、空间局限的情况下,噪声和风扇的耗电相对就会较大,如果希望低噪音,就需要加大通风口的面积,降低风速,或者控制设备内处理功耗,降低集成密度。对于环境温度很高,甚至考虑采用压缩机等制冷设备散热,但是也可能会带来更高的能耗和噪音,同时压缩机热端同样也需要考虑如何散热。

2.2 灰尘、油烟

灰尘、油烟对设备最主要的影响体现在散热上。灰尘会堵塞防尘网或空气过滤设备,附着在散热器上的灰尘,还会直接影响器件散热。灰尘还会带来其他一些影响,例如在连接器上堆积的灰尘,可能影响到新插入组件的连接可靠性。一般情况下,连接器设计的滑动行程和摩擦力已经考虑了插入过程推开灰尘,但是偶发的大颗粒灰尘堆积存在隐患。中兴通讯软基站设备采用了连接器保护一体式假单板设计,经过多种试验分析,能够有效防止这样的问题发生,同时还兼顾平衡风阻的作用。

根据中国大气监测的情况,很多城市地区总悬浮颗粒物(TSP)平均保持在2级,即0.2 mg/m3的水平上[8-10]。新闻报道显示在2006年4月沙尘暴天气下,北京TSP达到0.35 mg/m3,峰值达到2 mg/m3。按照多地区平均水平0.2 mg/m3来算,根据上面散热能力的计算,700 W系统散热每小时气流中所包含的颗粒物约为0.04 g,每年通过系统冷却系统的悬浮颗粒物约为350 g。如果对空气过滤,这些灰尘会使得系统的维护周期大大缩短,维护工作量以及OPEX上升。实际上,如果不过滤,大部分颗粒物会直接穿过系统,只有一小部分会在系统内,主要在气流受到阻碍的区域堆积,例如连接器。大量的分析认为,这样的颗粒灰尘对系统可靠性的影响并不大,系统防尘设计上,应该让这样的灰尘无障碍的穿过系统。

在多个现场采集的灰尘分析中,很多灰尘呈现絮状、纤维状,来源可能是植物(如杨树、柳树飘絮)、摩擦脱落的衣物纤维、植物焚烧产生的飘浮物等,这些纤维状灰尘吸附在空气过滤设备上,积累后就会增加系统风阻,影响系统散热,同时,随着空气过滤系统的网孔堵塞,更小颗粒的灰尘会被过滤,系统堵塞速度变快。因为气流摩擦产生静电的关系,絮状及颗粒状灰尘也会吸附在包括风扇扇叶、单板上,部分影响到系统的散热(如图5、图6所示)。在这种环境条件下,要通过过滤、隔离等手段,尽量避免灰尘进入设备,在防护设施上,也需要考虑增加通风面积、定期除尘等方式,保证整个环境的散热通畅。

灰尘中存在的盐类会吸收空气中的水分引起腐蚀。如果现场存在高湿度、甚至油烟,如老式建筑居民楼道、地下车库、农村民房等,灰尘会更容易黏附在设备上。在个别地方,甚至出现过设备防水百叶窗开口以及通风孔全部被灰尘及油烟混和物堵塞的现象。在这种场合下,往往结合腐蚀危害,需要整体考虑,采用例如热交换器柜等防护设备,在存在难以清理的油烟等环境条件下,应尽量避免安装设备,如不得不安装,应尽量采用密闭型的自然散热设备。

工业上对灰尘的处理有很多经验,包括惯性除尘、喷淋、过滤、静电吸附等多种方式得到应用[11]。对于通信设备,灰尘没有工业环境恶劣,而能够提供的动力、空间都非常有限;设备分散安装在各个站点,维护周期长甚至希望能够免维护,同时不允许出现高噪音、强烈振动。可以采用的主要就是惯性除尘、过滤等方法,减少一部分进入设备的灰尘。

从上面的分析可以看出,对于系统的防尘设计,也需要结合实际环境因素以及降低CAPEX和OPEX的需求。对很多室内应用,可以允许灰尘直接进入和穿过设备,减少维护开销;对于部分恶劣环境,考虑增加过滤装置,但需要考虑装置的容尘能力以及维护开销;对于部分运营商愿意进行设备维护,不希望灰尘进入设备的,可以使用防尘网;对于存在腐蚀性物质等的环境,要考虑采用内外环境隔离的设备。

2.3 湿度和腐蚀

从功能和性能角度,湿度和温度一起影响到空气和板材的介电常数,有可能减少高速设计的裕度,引发设备误码率增加等异常。从设备可靠性来看,湿度会加速腐蚀的发生,使得灰尘、有害气体等对设备的损害加剧。对于部分工艺不良的器件,空气中的水汽可能带来破坏性的后果。例如当半导体芯片钝化层不良时,在潮湿空气中可能发生内部分层,通过非偏置的高度加速应力测试(uHAST)试验可以识别此类工艺缺陷;密封不良的电阻器可能因为空气中含硫,发生硫化而损坏,需要通过选型规避。

一般认为,金属在洁净大气中,在相对湿度小于60%~70%的干燥大气中,发生腐蚀的速度非常慢,当相对湿度大于60%~70%时,腐蚀速度大大加快。如果空气中存在H2S、SO2等气体时,腐蚀速度也会加快。临界湿度随着空气成分、金属成分不同而有差异,积尘中的粒子也会增加吸附而导致腐蚀速度增加。但是总体上可以认为,通过控制使相对湿度小于60%,可以防止大部分大气腐蚀的发生[12]。

控制湿度的一个重要手段就是控制温度。设备中空气被加热时主要是显热增加,饱和水气压增大,绝对水气压并没有变化,导致空气的相对湿度降低。假设设备入口处的空气湿度接近饱和,设备内空气温升达到10度左右,即可以使得空气相对湿度降低到60%以下,避免腐蚀的发生。这个方法存在局限性:第一,为了保证低湿度,对空气进行加热,使得设备工作的温度升高,对于需要高温运行的设备,相当于恶化了设备的工作温度环境;第二,空气在设备中是逐渐被加热的,在进风口附近,湿度较高,灰尘堆积也较多,更容易发生腐蚀。

因为上述原因,一般认为,大部分单板上因为自热温升,可以认为正常环境腐蚀发生很慢。通过湿尘试验也可以对设备的自身对灰尘、湿度、盐分的抵抗能力进行预评估。对于腐蚀更容易发生的位置,如风扇、设备进风口等部件,要考虑防护。当环境十分恶劣时,需要考虑增加隔离等防护措施。对于维护要求低的部件,可考虑三防工艺,但是三防工艺会增加成本,加长加工周期,影响维修,喷涂还会增加对环境的污染。

根据经验,化工厂、港口、地下车库等,湿度很大,存在大量有害气体或盐雾,甚至机房环境在蓄电池使用不当的情况下,也会出现漏酸等情况,对机房内设备带来危害(如图7所示)。无防护的设备的腐蚀尤易发生在通风部件,对腐蚀的部件进行成分分析显示,腐蚀物主要的成分为硫和氯(如图8所示)。

目前的基站设计电路组装密度很高,中兴通讯软基站室外产品一般都采用纯自然散热或者热交换器柜,避免直通风场景。虽然直通风或者透气过滤膜能够降低设备成本,但是灰尘堵塞(透气膜产品)、对进气预加热以降低湿度的设计降低了散热能力,加之有害气体、灰尘、盐雾直接进入设备等问题,降低了产品的适用范围。对于环境洁净、抗腐蚀能力强、成本敏感,或者内部有蓄电池的设备,可考虑使用直通风设备。

2.4 其他问题

设备及相关配件在长期工作中,还会面临各种其他问题,例如雷击、水浸(水滴)、日晒、人为因素等等。

在夏季,雷击和水浸的问题相对较多。光缆加强筋、动力线引雷,加上有的机房接地装置安装不良甚至被窃,导致设备接地不良,可能使设备造成雷击伤害。设备工作环境的控制是一方面,另一方面室内设备的一些防护指标,按照标准已经不能满足现场的实际要求,实际控制要在标准上有所提升,但是又不需要达到室外的防护标准,形成对实际工作环境理解后的设计要求。设备设计上也往往会根据使用的经验,做高于标准要求的设计。

有的机房存在渗漏滴水,在6—7月雨季,雨水从机房屋顶渗漏,进入室内设备并可能在设备内部形成局部积累,造成短路,设备设计上要尽量做到防滴,但是这样又可能增加设备尺寸、并对上下直通风道等热设计方式带来影响。

室外安装设备长期暴露在日光下,日晒会为带来设备额外的热负荷,需要使用遮阳棚/罩等方法避免日光直晒;日光照射导致的冷热循环盈利,以及紫外线对漆面分解,可能使得漆皮老化剥裂,塑胶套管脆化。

这些因素和设备相关,但很多已经不属于设备设计解决的范围,需要从多方面分析和解决。运营商和施工单位在进行机房设计建设的时候,需要考虑实际应用的不确定因素,控制施工质量,根据实际环境需要进行合理的辅料选材,为设备提供接近于设计指标的工作环境。综合设备异常损坏维修以及业务中断的成本,而不是一味的考虑材料成本,进行成本优化的工程设计与施工。

3 结束语

综上所述,通信设备的环境适应性设计,在可靠性物理的基础上,涉及到材料学、热力学、环境科学等多专业配合,需要结合很多实际工程环境和设备工作场景研究的经验,综合考虑运营商降低CAPEX和OPEX的需求,在一系列相互冲突的限定条件之中进行优化平衡。同时,通信设备环境适应性设计,在日益复杂的应用场景面前,无法只考虑设备自身,而是对环境也需要提出精细的要求,研究设备和环境的交互作用,通过设备制造商与运营商的共同配合与努力,确保整体方案的优化和可靠。

参考文献

[1] Extreme climatic conditions and derived conditions for use in defining design/test criteria for NATO forces materiel [R]. NATO STANAG 2985.

[2] 李永红, 徐明. MIL-HDBK-217可靠性预计方法存在的问题及其替代方法浅析 [J]. 航空标准化与质量, 2005(4):40-43.

[3] 曾纪科. 美军标的修订与塑封微电路在军用设备上的应用 [J]. 电子产品可靠性与环境试, 1998(4):45-48.

[4] CROWE D, FEINBERG A. Design for reliability [M]. Boca Raton, FL,USA:CRC Press, 2001.

[5] HNATEK E R. Practical reliability of electronic equipment and products [M]. New York, NY, USA: Marcel Dekker, 2003.

[6] MIL-HDBK-338B. Electronic reliability design handbook [S]. 2012.

[7] Lecture: Air movement and natural ventilation [EB/OL]. [2012-03-25].

http://www.arch.hku.hk/teaching/lectures/airvent/.

[8] GB 3095—1996. 环境空气质量标准 [S]. 1996.

[9] 甘肃省环境保护厅. 甘肃省环境质量概要(2010年度) [R]. 2010.

[10] 内蒙古自治区环境保护厅. 2006年内蒙古自治区环境质量状况公报 [R]. 2006.

[11] MODY V, JAKHETE R. Dust control handbook [M]. Park Ridge, NJ,USA:Noyes Data Corp, 1988.

[12] 陈鸿海. 金属腐蚀学 [M]. 北京: 北京理工大学出版社, 1995.

作者简介

郭丹旦,北京理工大学硕士毕业;中兴通讯股份有限公司系统架构师,从事无线通信软基站BBU硬件架构设计工作。

唐雄,中兴通讯股份有限公司BBU系统部部长;从事无线通信系统开发工作。

崔卓,吉林大学硕士毕业;中兴通讯股份有限公司系统架构师,从事无线通信软基站软件架构设计工作。

上一篇:统一的IPv4/IPv6翻译与封装过渡技术——IVI/MA... 下一篇:圆齿野鸦椿营养器官的解剖学观察