IMS容灾应用方案探讨

时间:2022-10-13 02:33:15

IMS容灾应用方案探讨

摘 要:随着IMS网络在通信网络中的应用规模日益壮大,网络用户日益增多,整个网络的容灾问题也显得日益重要,本文通过对IMS网络的容灾机制和原理进行了描述,对PCSCF、I/SCSCF、HSS等网元的容灾方案进行了探讨。

关键词:IMS 容灾方案

1.容灾方案介绍

1.1IMS核心侧组网

在IMS网络中,Site1与Site2组成互助容灾局,CSCF对接是采用负荷分担方式容灾、HSS采用主备方式容灾。CSCF1(P/I/S-CSCF1)与CSCF2(P/I/S-CSCF1)互助容灾,HSS1与HSS2互助容灾,MGCF1与MGCF2互助容灾。

1.2容灾机制和原理

1.2.1 Option故障检测机制

启发式Option检测:CSCF(P/I/S-CSCF)、AS用于检测对端故障的机制,做到有故障时才检测,无故障不产生检测流量。简单的说就是当业务消息发送超时无响应,则向对端发起Option检测,多次无响应说明对端已故障,将对端加入故障列表,并周期性检测其是否故障恢复,如果能够收到检测消息的响应,则说明对端故障恢复,将其从故障列表中恢复出来,检测停止。

周期性Option检测:MGCF、SBC、、AGCF采用的用于检测对端是否故障的机制,简单的说就是周期性向检测的对端发送Options消息来确认其是否故障,周期和故障确认次数可配置,方便在检测灵敏度和性能之间取得均衡。

基于链路的故障检测:检测HSS、CCF等Diameter设备是否故障的机制或者检测DNS等建立TCP链路的设备是否故障的机制,简单的说就是在链路上周期性的发送握手心跳消息来检测对端是否故障。举例来说,每5秒发送一次握手消息,连续3次无响应则认为对端故障。

1.2.2CSCF数据备份机制

当用户在CSCF上进行初始或重注册时,S-CSCF鉴权通过后,检查收到的注册请求中IMPI、Contact、Path信息是否和本地对应IMPI的Contact、Path信息一致,如果不一致或者本地没有这些信息,则需要根据IMPI通过SAR中扩展AVP USER BACKUP DATA携带容灾数据(Contact头域包括参数、Path头域包括参数)保存到HSS上,同时刷新本地数据;

HSS收到SAR请求后,检查用户是否已注册,如果未注册,则直接将USER BACKUP DATA AVP包含的容灾数据按IMPI保存到用户数据中;如果该IMPI已注册,则根据收到USER BACKUP DATA AVP的信息刷新本地保存的容灾数据,成功后返回SAA,响应码置为DIAMTER_SUCCESS。

1.2.3 CSCF容灾故障倒换机制

主用局CSCF1故障,根据接入方式的不同,分别由全SBC、AGCF、UE将注册消息发往容灾局CSCF2,CSCF2从HSS恢复用户数据,完成用户注册,同时完成HSS上容灾数据的更新。注册完成后,后续UE在容灾局CSCF2进行业务处理,如同在主用局CSCF1上获取业务一样。

主用局HSS1故障,CSCF通过TCP/SCTP链路检测到HSS1故障,则通过容灾局HSS2获取签约数据和容灾备份数据,主用局HSS1与HSS2的数据实时备份同步,保证容灾时获取的数据一致。

主用局AS1故障,CSCF通过Option检测到AS1故障,将注册和业务消息发往容灾局AS2,AS2从HSS恢复数据并正常提供服务。

主用局MGCF1故障,CSCF通过Option检测到MGCF1故障,将互通的业务消息发往容灾局MGCF2,MGCF2正常处理业务。

1.2.4 CSCF故障恢复倒回机制

主用局CSCF1故障恢复,根据接入方式的不同,分别由全SBC、AGCF、UE在注册或重注册是将注册消息重新发往主用局CSCF1,如果是初始注册,按正常注册流程处理,如果是重注册,主用局CSCF1从HSS恢复用户数据,完成用户重注册,同时完成HSS上容灾数据的更新。注册完成后,后续UE在主用局CSCF1正常进行业务处理。

主用局HSS1故障恢复,CSCF通过TCP/SCTP链路检测到HSS1故障恢复,则通过主用局HSS1获取签约数据和容灾备份数据,主用局HSS1与HSS2的数据实时备份同步,保证容灾时获取的数据一致。

主用局AS1故障恢复,CSCF通过Option检测到AS1故障恢复,将注册和业务消息发往主用局AS1,AS1从HSS恢复数据并正常提供服务。

主用局MGCF1故障恢复,CSCF通过Option检测到MGCF1故障恢复,将互通的业务消息发往主用局MGCF1,MGCF1正常处理业务。

2.PCSCF网元的容灾方案

当检测到主用局PCSCF1故障时,如果有注册,接入网元全SBC、AGCF将注册消息发往容灾局PCSCF2进行注册。

如果有呼叫,周边网元全SBC、AGCF、MGCF、AS将呼叫请求发往容灾局PCSCF2,容灾局PCSCF2根据配置放通呼叫。

PCSCF收到REGISTER时,一般情况下,所有终端配置的注册服务器地址应该是一样的,因此根据符合分担的原则,PCSCF1应该把REGISTER发给ICSCF1,PCSCF2应该把REGISTER发给ICSCF2。为了实现上述目标,有两种DNS配置方案:一是采用内置DNS,对于PCSCF1来说,配置ICSCF1优先,对于PCSCF2来说,配置ICSCF2优先;二是采用外置DNS时,需要外置DNS根据不同的PCSCF来源配置不同优先级,对于PCSCF1来说,配置ICSCF1优先,对于PCSCF2来说,配置ICSCF2优先。因此,在容灾局PCSCF2收到主用局用户的REGISTER请求时,根据DNS查询把注册请求发送给容灾局ICSCF2。

ICSCF收到REGISTER时,会根据HSS查询结果进行转发:如果HSS返回时带SCSCF地址,ICSCF会转发到此SCSCF,如果ICSCF发现此SCSCF故障,会根据能力集选择一个SCSCF;如果HSS返回时带SCSCF能力集,ICSCF会根据本地配置的能力集选择SCSCF。一般来说,两个容灾局的SCSCF应该具有相同的能力集,因此,为了是的ICSCF在初始注册的时候选择本地的SCSCF,在ICSCF上配置能力集时,总是把本地SCSCF的记录放在前面,这样ICSCF会选择排在前面的SCSCF。在P独立组网的场景下,此时主用局SCSCF1还是正常运行的。因此,在容灾局ICSCF2收到主用局用户的REGISTER请求时,由于此时用户已经在主用局S-CSCF1注册,容灾局ICSCF2会先往主用局SCSCF1转发REGISTER。

CSCF恢复后,SBC通过SIP OPTION确认主用CSCF1恢复,SBC通过手动倒回的方式来实现到主用CSCF的倒回恢复。SBC把后续请求(包括注册和呼叫)都发送到主用CSCF1。

3.I/SCSCF网元的容灾方案

主用局I/S-CSCF1故障,P-CSCF通过启发式SIP OPTION检测I/S-CSCF1故障,由于主用局I-CSCF1故障,P-CSCF将注册消息发往本局的I-CSCF2,I-CSCF2优选本局S-CSCF2作为注册服务器,S-CSCF2从其对应的主用HSS即HSS2恢复用户数据,完成用户注册,同时完成HSS2上容灾数据的更新。注册完成后,在容灾局进行业务处理,如同主用局一样。AS或MGCF通过心跳检测发现主用局I/S-CSCF1故障,将业务消息发往容灾局I/S-CSCF2,容灾局I/S-CSCF2从HSS恢复容灾数据,正常提供业务。

主用局I/S-CSCF1故障恢复,P-CSCF检测I/S-CSCF1恢复,将注册(或重注册)消息重新发往主用局I/S-CSCF1,P-CSCF根据DNS的SRV记录优先级将注册消息发往主用局I-CSCF1,由于PCSCF独立组网,SCSCF上的用户数据数据迁移需要配置手动倒回的方式,SCSCF根据Path来决定倒回哪些注册用户,如果是初始注册,按正常注册流程处理,如果是重注册S-CSCF1从HSS恢复用户数据,完成用户重注册,同时完成HSS上容灾数据的更新。注册完成后,在主用局正常进行业务处理。AS或MGCF通过心跳检测发现主用局CSCF1故障恢复,将业务消息重新发往主用局I/S-CSCF1,主用局I/S-CSCF1从HSS恢复容灾数据,正常提供业务。

4.SCSCF 恢复后的手动用户迁移

1、手动命令到CSCF,指示CSCF进行手动用户迁移,迁移条件有三种选择:根据用户个数进行迁移;根据用户百分比进行迁移;根据用户注册的Path路径进行迁移。(根据浙江的实际情况浙江选择根据用户注册的Path路径进行迁移方案)

2、终端进行注册时,CSCF检查此用户是否有呼叫存在,如果无呼叫存在,则返回305指示选择另外的CSCF;如果有呼叫存在,为了不影响正在进行的呼叫,CSCF允许此用户在本CSCF上注册。

5.HSS网元的容灾方案

CSCF/AS配置HSS主用局和容灾局为主备工作模式,正常情况下,CSCF/AS都是到主用局查询用户呼叫。

当主用局HSS故障时,CSCF/AS与主用HSS的所有Diameter链路断链。CSCF/AS判断主用HSS不可达,根据链路的优先级,CSCF/AS会将业务消息将发往容灾HSS局点。

当主用HSS局点恢复正常,CSCF/AS与主用HSS的Diameter链路将恢复正常。CSCF/AS判断主用HSS可达,根据CSCF/AS配置的主用HSS链路优选原则,CSCF/AS会将所有业务消息发往主用HSS局点。

周边要求:HSS-FE与CSCF/AS链路对承载网的要求:带宽的要求:7.1Mbps/百万用户;QOS要求为:延时

约束限制:SPG到HSS采用主备的方式进行发放。这里要注意两点:一是SPG上会配置到主备HSS的链路,但是正常情况下只激活到主用HSS的链路;二是主用HSS故障后,SPG会自动激活到备用HSS的链路,但是此时要求手动切换HSS的BE为主用,否则发放会返回失败。

参考文献

1、中国移动通信研究院,《中国移动CM-IMS总体技术要求v0.6》,中国移动通信集团公司,2009

2、华为公司,《江苏移动IMS新建项目技术建议书V1.2》,华为公司,2009

3、 华为公司,《江苏移动IMS试商用系统技术建议书(核心网部分)》,华为公司,2009

4、 华为公司,《江苏移动IMS试商用系统技术建议书(业软部分)》,华为公司,2009

5、 赵绍刚等,IMS网络部署、运营与未来演进,电子工业出版社,2011

作者简介:

田荣明:2004年毕业于重庆邮电学院计算机应用专业,获硕士研究生学位,2004年至今在中国移动通信集团重庆有限公司工作。

上一篇:浅论钢筋混凝土桥梁病害的分析及处理 下一篇:环境条件对害鼠发生量影响