时间:2022-08-20 09:38:23
摘要:按照中国气象宽带网建设计划,建立了部级和省级数据传输、通信数据处理和系统监视的统一管理平台。辽宁省级节点采用负载均衡集群技术,搭建由多台服务器组成的负载均衡集群系统,提升系统整体可靠性。该文分析了气象通信系统体系结构,给出了气象通信系统的故障处理和维护方法。
关键词:集群;负载均衡;通信
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2014)03-0650-03
随着人们对气象预报信息和灾害预警实时性需求的增加,现代气象对信息系统提出了高可用性和高可靠性等更高的要求。新一代国内气象通信系统是近年中国气象局在全国展开的重点项目,是中国气象局宽带网项目的组成部分,旨在满足日益增长的实时气象通信业务的需求,进一步提高通信网络系统对省际气象信息共享的支持能力。该文首先介绍了新一代国内气象通信系统体系结构,然后对业务监控管理平台、数据收发与存档系统操作进行了详细描述,最后给出了气象通信系统故障处理和维护的方法。
1 体系结构
新一代国内气象通信系统建设[1]采用全国气象宽带网主干网络,通过负载均衡集群技术,对外提供包括数据传输服务和WEB服务。为满足实时气象通信业务系统的要求,系统采用多线程、多进程等技术,同时也对集群文件系统和数据的并发处理等方面进行了规划。
新一代国内气象通信系统辽宁省级节点,由四台服务器以及其连接的SAN(Storage Area Network,即存储区域网络)和数据网络[2]组成。SAN是一种通过光纤集线器、光纤路由器、光纤交换机等连接设备将磁盘阵列、磁带等存储设备与相关服务器连接起来的高速专用子网。在新一代国内气象通信系统设计中,为提高通信业务的高可用性,在每台服务器上配置一个以太网接口作为专用集群心跳线连接。心跳线主要用于主从服务器之间,是连接工作机与备份机的网线,通过软件的方式监视工作机,备份机一旦发现工作机由于某种原因停止服务, 心跳线会反映给互为备份的另外一台主机,备份机立即投入使用, 这样可以在最大限度保证网络的畅通和服务的正常运行。
2 系统功能
新一代国内气象通信系统主要包括系统菜单区、功能菜单区、数据显示区,信息提示区。系统菜单区主要用来显示系统的所有的模块菜单,模块访问权限的设定,同时附加显示登录用户名称、登录时间和系统的当前时间;功能菜单区主要用来显示用户选定模块下的所有功能菜单;数据显示区主要用来显示系统各功能产生的数据;信息提示区主要用来显示气象警报、业务公电、缺报通知提示。
实时监视[3]模块主要包括状态监控、信息浏览以及系统产生的重要信息提示内容。信息服务描述数据下载、定制功能,重要信息的使用。信息查询描述在该系统中如何进行文件、站号历史和实时资料查询、监视状态历史信息查询等。信息统计描述正在该系统中如何进行文件、站号资料传输信息的统计查询、系统监视信息的统计查询,以及图表显示和打印。质量统计描述在如何使用该系统对考核资料(站号级接收、文件级接收)进行统计查询,并形成打印文档。系统配置描述在使用系统之前如何对系统中使用到的系统参数、权限管理、字典信息、监控配置信息、系统使用到的资料类型信息进行正确详细的配置。
3 业务运行
3.1 报文处理
报文处理包括错报修改、报文录入、报文调阅三部分。
错报查阅是指收发子系统经过报文格式检测,将错报报文存放到数据库中,供用户查看。同时用户可以修改或删除错报,修改后的报文传送给收发子系统处理。用户双击列表中错报文件名,即可在右侧显示该份错报文件内容。用户选择错报文件名,即可删除选中的错报文件。用户也可以在右侧的报文显示区域中编辑修改错报,点击“修改”,即可保存并传输报文,同时将该份错报删除。
报文录入是指输入常规观测报文。用户需要指定报类、日期、时次等信息,报文录入完毕后,将由应用服务器发送给收发自系统处理。
报文调阅是根据用户指定的条件,在全网范围内进行搜索,将符合条件的报文返回给用户。报文调阅界面见图报文调阅界面,用户可以选定的条件包括资料类型、报类、区站号、资料时次。
3.2 数据存档
数据存档[4]进程获取存档目录中的所有收集文件,按照文件名中包含的资料类型、资料子类型、时间信息进行站号级存档和目录存档。
进程提交命令:mms_ar_aws [-i],当带-i 参数提交进程时,用户可以修改进程休眠时间,单位为分钟,系统缺省休眠时间为5分钟。
目录存档文件成功存档后,存档信息保存在数据库的数据文件存档信息表TR_DIRFILE中,站号级存档文件成功存档后,存档信息保存在数据库的观测资料存档信息表TR_OBSERVE中。
存档数据整理进程将观测资料存档信息表(TR_OBSERVE)中存档信息按发报时间、资料类型、资料子类型进行整理,计算每个时次的来报站数。进程提交命令mms_ar_service,观测资料存档信息表为TR_OBSERVE。
4 故障处理
当主机故障或网络故障后,要手工重发信息。在发送失败后,系统会根据配置中设置的重试次数和重试间隔时间重新尝试分发,当重试次数达到配置中的重试次数后系统会报警,同时重试的间隔时间会越来越长,所以在发生故障后最好手动启动重发。需要停止/启动集群资源,查看资源状态。
资料类型及文件名模板的改动,例如修改了有效接收时间,与应用软件有关,如果在web页面上修改的,需要重新启动应用进程。如果在web上看不到新增类型,或所做修改,需要重新启动tomcat。
“文件及节目表配置”、“站号级节目表配置”修改后,只涉及到前端web网页的监视,可以不用重新启动后台应用软件。需要立即生效,可以点击页面上的“立即生效”
修改配置文件DIR_CONFIG.1时,要在集群上重新启动cma_preproc,cma_dir_check进程;修改了/bcsy/workdir/srv1/etc/AFD_CONFIG后,一定要重启动应用,或者在HA管理界面重新启动。
修改资料类型表、文件名模板表后,要重启应用进程。对于普通前缀,直接在原始文件名前增加前缀prefix add MSG__;特殊前缀,根据系统内置的一定的换名规则换名处理;对于AGM报同时有新旧两种文件名格式,旧的格式需要加前缀AGM__,新格式为长文件名格式不需要加前缀,这种情况就可以通过在前缀AGM__前加9实现,prefix add 9AGM__;删除前缀只能删除固定前缀,在[directory][files][options]中增加配置项,prefix del MSG__。
主备地址切换,分为自动切换和手工切换两种。
TEST:172.19.2.236:172.19.1.81:::4:100:600:4096:10:-1:120:0:0:1:0:0:0:0:0
cma_afdcmd –s TEST 主机主备地址手工切换
cma_queue_spy 查看发送队列
cma_fsa_view TEST 查看TEST主机的参数
定时处理的任务收到后会被临时搬到temp目录下,直到定时时间才开始处理。因外,文件通配符配置中的排除项需要注意顺序,文件通配符按顺序匹配。
5 结束语
目前,气象行业内部跨广域网范围的新一代国内气象通信系统已经初步建成,我省实现了省内所有气象信息,通过新一代国内气象系统向国家气象信息中心的快速传输。由于采用负载均衡和集群技术,省内气象信息传输处理时间和效率较老系统有较大的提升,其中常规气象信息传输处理时效提升了四倍以上。日后需要进一步完善省级通信系统业务工作流程,完善系统资源使用管理制度,充分发挥省级新一代国内气象通信系统的效益。
参考文献:
[1] 肖文名,酆嶶,杨根录.气象信息传输业务流程优化的初步分析[J].应用气象学报,2009,20(4):497-503.
[2] 李明皓,赵威,马廷淮.国家气象应用网格系统的设计[J].计算机工程,2008,34(23):283-285.
[3] 刘金霞,王慧瑜.省级新一代国内气象通信系统传输流程的设计与实现[J].气象与环境学报,2012,28(6):76-80.
[4] 林润生,孙周军,谭小华. 新一代国内气象通信系统设计与实现[J].气象,2011,37(3):356-362.
省级三好学生申请书 省级健康创建工作计划 省级创建申报材料 省级卫生乡镇申报材料 省级卫生单位申报材料 省级团员事迹材料 省级技术中心汇报 省级文明单位履职报告 省级文明单位汇报材料 省级文明单位申报材料