IMS核心网元准POOL容灾方案研究

时间:2022-07-15 06:16:52

IMS核心网元准POOL容灾方案研究

[摘要]P-CSCF、S-CSCF是IMS核心网元,其组网可靠性关系到IMSA务提供的稳定性。文章分析了异地组网容灾方案的实现以及存在问题,然后提出P-CSCF、S-CSCF的准POOL组网方案,并阐述组网要求、容灾数据备份和容灾接管实现。该方案提高了容灾组网的可靠性,对IMS商用网络规划、组网部署具有一定参考价值。

[关键词]准POOL P-CSCF S-CSCF 实时接管 容灾方案

1 引言

随着网络融合演进趋势的加快以及多媒体业务应用需求的增加,中国电信加紧部署IMS网络,IMS网络将成为未来融合核心网的新核心,其规模难以估量。IMS网络安全关系到整个电信网络以及业务的安全,因此,有必要研究IMS网络的安全组网方案。

P-CSCF是用户接入IMS网络的初始入口点,将拜访地接入网络的SIP事务转接到其归属地的S-CSCF。S-CSCF是IMS的核心设备,位于用户的归属网络,为uE提供注册管理和认证鉴权,并为IP多媒体业务呼叫的建立、维持和释放提供控制功能。因此,S-CSCF、P-CSCF是IMS网络非常重要的核心网元。而目前组网方式无法满足大规模商用的需求,一旦主用设备瘫痪后,会导致业务接管时间过长、对用户影响非常大等问题。而采用准POOL容灾组网方案,会进一步提升IMS网络的健壮性。

2 目前容灾方案分析

2.1 容灾方案的实现

异地容灾组网的主要实现方式有:1+1主备、1+1互备、负荷分担、POOL和N+1备份。目前P-CSCF和S-CSCF的组网方案如下:

P-CSCF采用负荷分担方式,在正常情况下,相邻网元按照一定比例将话务负荷分担到N个设备;当有一个设备故障失效,相邻网元将所有话务负荷分担到其它N-1个设备,接管设备非实时进行容灾业务处理。

S-CSCF采用N+1备份方式,在正常情况下,相邻网元按照一定比例将话务负荷分担到N个S-CSCF设备,另一个处于冷备份状态;当一个主用的S-CSCF设备故障失效时,相邻网元将故障设备所承担的话务接续到备份S-CSCF,备份S-CSCF设备非实时接管业务。

2.2 容灾方案存在问题

目前容灾方案主要存在如下问题:

(1)无法及时恢复业务。P-CSCF和S-CSCF所采用的组网方式,一旦用户注册所在的主用设备瘫痪后,需要等待用户重新注册才能恢复业务,无法实现业务的实时接管。

(2)无法确保接管有效性。S-CSCF采用的N+1备份方式,由于处于备份的设备在平常没有负荷,难以保证在应急情况下的有效接管。

(3)设备投资成本高。如这些网元采用1+1互备方式,可提高可靠性,但冗余度相当高,投资成本高,而且设备之间需要实时同步容灾数据才能确保业务实时接管,对设备性能开销较大。

(4)用户感知的影响大。目前方案通过用户重新注册来实现业务非实时接管,这样就对用户感知的影响很大,可能会导致用户在一段时间内无法通话。

3 准POOL方案的优势

为了解决上述问题,可以采用准POOL组网方式。准POOL组网方式是指N个设备组成一个池,池内设备提供负荷分担服务,网元之间通过非数据同步方式实现资源共享。当一个设备瘫痪,其余N-1个可以通过一定方式获取共享数据进行实时接管,不需要等待用户重注册。与POOL方式最大的不同是,容灾数据不再通过网元之间的数据同步实现,而是巧妙地通过HSS数据共享或者容灾查询实现,一方面确保业务实时接管,另一方面设备性能开销很小,满足集约化运营需求。业务实时接管是指接管设备能为已注册用户未进行周期注册更新时提供完整的业务服务。

异地容灾组网方式的容灾切换指标分析如表1所示。

从表1可知,准POOL技术比目前的容灾组网方式具有绝对优势:业务实时接管、用户基本无感知、设备利用率高、投资成本低和较为容易实现。因此,对于需要容灾数据才能恢复业务的网元,P-CSCF、S-CSCF建议采用准POOL方案组网。

4 P-CSCF准POOL方案

4.1 容灾组网要求

N个P-CSCF设备组成一个准POOL,在正常情况下,BAC支持按照一定比例将话务负荷分担到准POOL的所有设备中;当一个P-CSCF设备故障失效时。BAC和S―CSCF将故障P-CSCF承载的话务负荷分担到准POOL的剩余其他设备,接管的P-CSCF设备通过I-CSCF查询获取用户当前注册的S-CSCF实时接管业务。

P-CSCF准POOL(以N=3为例)的组网结构图1所示。

上述组网方式对于用户初始注册请求,BAC采用负荷分担的方式选择P-CSCF准POOL内的设备,可采用DNS配置方式:BAC在一个信令分组中,配置一个P-CSCF的域名。假设为,用户注册时采用此域名进行SRV查询。DNS的SRV配置池内所有设备的主机名,采用相同优先级,权重可以根据实际需要进行配置。为了实现容灾的负荷分担,DNS对POOL中每一个P-CSCF主机都配置SRV查询,对于本主机采用高优先级,所有剩余主机都采用相同的低优先级。DNS配置关系如表2所示。

假设用户原来注册在P-CSCF1故障失效,对于已经注册的用户的呼叫、重注册请求,BAC和S-CSCF根据DNS返回的序号为2的记录,将话务负荷分担到P-CSCF2和P-CSCF3,从而实现到N-1个设备上的负荷分担。

4.2 容灾数据备份

P-CSCF所需要容灾备份数据就是用户当前服务的S-CSCF,按照标准注册流程,在用户注册时,S-CSCF通过信令与HSS进行交互,HSS就会记录用户当前服务的S-CSCF,不增加额外备份需求。

4.3 容灾接管实现

P-CSCF容灾接管主要考虑已注册用户的主叫和被叫业务实现,已注册用户的重注册、新用户注册与原有标准流程一致。

(1)已注册用户主叫业务接管

已注册用户尚未进行周期更新而发起主叫业务时,通过如下流程实现实时接管,假设P-CSCF1故障失效,P-CSCF2进行业务接管:

已注册在P-CSCF1的用户向BAC发起呼叫,BAC将呼叫转发到P-CSCF2。

P-CSCF2发现没有用户注册数据,根据主叫用户的域名查询DNS,将呼叫请求发往主叫用户归属的I-CSCF,在INVITE消息中提取PPI域的主叫号码构造PAl,并在INVITE消息的增加restore=1参数,标识接入侧P-CSCF/AGCF发来的消息。

I-CSCF根据restore=1参数构造Cx接口的User-Authorization-Type取值为2,并根据orig参数提取主叫 号码向HSS发送LIR消息。

HSS处理LIR请求时,根据User-Authorization-Type取值为2,返回主叫用户的S-CSCF能力集和动态S-CSCF name。

I-CSCF优先使用动态S-CSCF name路由,并呼叫请求消息送到S-CSCF。

S-CSCF收到呼叫请求后,根据restore=1参数识别是UE始呼流程,根据orig触发主叫侧业务,从而完成容灾业务接管。

(2)已注册用户的被叫业务接管

对于原来注册在故障P-CSCFI的用户的被叫接管,被叫S-CSCF将呼叫负荷分担到P-CSCF准POOL的其他设备:

S―CSCF收到MT呼叫,根据用户的记录主机名P-CSCF1进行DNS查询,DNS返回相应的P-CSCF优先级列表,S-CSCF检测到优先级最高的P-CSCF1故障失效后,S-CSCF在优先级低的P-CSCF任选一个,假设为P-CSCF2。

根据SIP协议要求,S-CSCF将Request URI封装为BAC的IP地址,将呼叫消息发送给P-CSCF2。

P-CSC-F2根据容灾策略放通呼叫,并根据Request URI将呼叫路由到用户注册的BAC,BAC按照正常呼叫进行处理就可以完成业务接管。

5 S―CSCF准POOL方案

5.1 容灾组网要求

N个S-CSCF设备组成一个池,池内设备提供负荷分担服务。在正常情况下,相邻网元支持按照一定比例将话务负荷分担到准POOL的所有设备中,网元之间通过HSS数据存储实现容灾数据共享,当一个S-CSCF瘫痪,其余N-1个S-CSCF设备进行负荷分担,可以通过HSS查询获取容灾数据进行实时接管,无需等待用户的重注册。

S-CSCF准POOL(以N=3为例)的组网结构如图2所示。

上述组网方式对于用户初始注册请求,I-CSCF根据用户的S-CSCF能力集采用负荷分担的方式选择S-CSCF准POOL内的设备;对于用户的主叫和被叫,选择用户初始注册选定的S-CSCF。

5.2 容灾数据备份

在用户开户时,HSS已经保存了用户签约数据。为了实现业务实时接管,在用户注册过程中,S-CSCF通过Cx接口将容灾数据以透明数据形式存放在HSS,需要备份的容灾数据包括:

(1)用户注册路由信息Path头域:新的S-CSCF在处理被叫请求时,需要依靠它来找到正确的P-CSCF。

(2)用户注册的Contact地址:新的S-CSCF在处理被叫请求时,需要依靠它来构造请求目的地。

(3)用户鉴权的Authentication Method:新的S-CSCF在处理注册或者呼叫鉴权时使用的鉴权参数。

5.3 容灾接管实现

S-CSCF容灾接管主要考虑已注册用户的重注册、主叫和被叫业务的实现,新用户注册与原有流程一致。

(1)已注册用户的重注册接管

已注册用户发起重注册请求时,P-CSCF无法将重注册消息送到故障的S-CSCF1,将通过I-CSCF查询HSS获取S-CSCF能力集,选择一个可用的S-CSCF2注册。后续发起的业务请求将由重注册选定的S-CSCF2处理:

P-CSCF将重注册消息转发给I-CSCF,I-CSCF启用UAR消息查询HSS,其中User-Authorization-Type取值为0。

HSS返回用户当前服务的S-CSCF给I-CSCF,I-CSCF判断当前服务的S-CSCFB经故障失效,重新发起UAR消息查询HSS,其中User-Authorization-Type取值为2。

HSS返回注册用户的S-CSCF能力集,I-CSCF根据用户的S-CSCF能力集选择一个可用的S-CSCF2,从而由S-CSCF2接管容灾用户。

(2)已注册用户的主叫业务接管

已注册用户未进行周期更新时发起主叫业务请求,P-CSCF将业务请求转发到I-CSCF,I-CSCF通过与HSS的信令交互后选择可用的S―CSCF2提供服务,S-CSCF2重新从HSS下载用户签约数据和容灾数据,从而恢复用户业务:

已在S-CSCF1注册用户向P-CSCF发起呼叫请求,P-CSCF检测到S-CSCF1故障失效后,根据用户域名查询DNS获取用户归属的I-CSCF,向I-CSCF发送呼叫请求。P-CSCF在INVITE消息中提取PPI的主叫号码构造PAI,并增加restore=1参数,标识接入侧P-CSCF/AGCF发来的消息。

I-CSCF根据restore=1参数构造Cx接口的User-Authorization-Type取值为2,并根据oring参数提取主叫号码向HSS发送LIR消息。

HSS处理LIR请求时,根据User-Authorization-Type取值为2,返回主叫用户的S-CSCF能力集和动态S-CSCF name。

I-CSCF优先使用动态S-CSCF name路由,并透传Route头域中的参数到S-CSCF。此时S-CSCF name对应的S-CSCF1不可用,则根据S-CSCF能力集负荷分担选择准POOL中一个可用的S-CSCF2。

s-CSCF2收到呼叫请求后,发现没有注册数据,向HSS发送查询用户数据SAR请求,Server-Assignment-Type取值为O。

HSS通过SAA将用户签约数据和容灾数据返回S-CSCF2,并将用户注册所在的S-CSCF1更新为S-CSCF2。

S-CSCF2根据restore=1参数识别是UE始呼流程,根据orig触发主叫侧业务,从而完成业务接管。

(3)已注册用户的被叫业务接管

已注册用户未进行周期更新时接收被叫业务请求,具体实现方法如下:

主叫S―CSCF将呼叫送到被叫I-CSCF,被叫J-CSCF根据被叫用户向HSS发起普通的LIR请求(不含User-Authorization-Type),HSS返回用户当前故障的S-CSCF1。

1-CSOF发现S-CSCF1故障,再次向HSS发起特殊的LIR请求,携带User-Authorization-Type为2,HSS返回被叫用户的S-CSCF能力集和动态S-CSCF name。

I―CSCF根据S―CSCF能力集负荷分担选择准POOL中一个可用的S-CSCF2。

S-CSCF2收到呼叫请求后,发现没有注册数据,向HSS发送查询用户数据SAR请求,Seryer-Assignment-Type取值为0。

HSS通过SAA将用户签约数据和容灾数据返回S-CSCF2,并将用户注册所在的S-CSCF1更新为S-CSCF2。

41,S-CSCF2根据获取的签约数据触发被叫侧业务,并根据path头域发送到用户注册的P-CSCF进行后续处理,从而完成容灾业务接管。

6 结束语

本文所述的P-CSCF、S-CSCF的准POOL组网方案进一步提升了IMS网络的稳定性,在确保容灾业务实时接管前提下,优化了容灾数据备份和接管实现方法,降低投资成本和提升设备利用率,有力推动IMS网络大规模商用,对IMS网络规划、组网部署具有极高参考价值,对容灾组网技术的研究也具有重要指导意义。

参考文献

[1]国电信IMS网络设备技术要求中国电信集团公司,2010年10月

[2]中国电信BAC设备技术要求中国电信集团公司,2010年10月

作者简介

许盛宏:毕业于重庆邮电学院通信工程系,工学学士,工程师,任职于中国电信广东研究院网络运营支撑部,主要负责IMS网络、CDMA网络的关键技术研究。

李力卡:大学本科,高级工程师,任职于中国电信股份有限公司广东研究院网络运营支撑部工作,核心网络室主任。

刘智德:毕业于北京邮电大学信息工程系,工学学士,工程师,任职于中国电信广东研究院网络运营支撑部,目前主要负责IMS网络、CDMA网络的关键技术研究。

上一篇:中国移动TD高精度同步网建设 下一篇:从LightRadio看移动网络面临的挑战及发展趋势