挖掘寿险行业软件价值

时间:2022-05-01 10:34:19

挖掘寿险行业软件价值

词根与命名规范在信息表示和数据模型展现方面具有突出地位,而基于表单的数据模型横向、纵向设计的思路,在数据结构适应性、扩展性方面亦具有重要价值。

行业领域的应用软件其核心价值往往首先体现在行业数据模型的设计之上,数据模型的准确描述首先要保证每个数据元素命名的规范和准确,对词根的规范和整理成为基础工作。词根与行业领域紧密相关,源于行业中的术语,同时必须符合一定的约束规则,并且表达准确的含义,保证词根易于理解、易于应用。数据库的设计中,字段名、表名以及其他相关元素的名称都需要以词根为基础,结合业务内容,按一定的规则进行命名。

数据模型的建立、字段的设计以基于表单的理论依据进行设计和描述,数据表通过横向、纵向的表单类型划分为事实表、约束表、维度表和代码表,结合表单文档和数据库说明清晰准确地对数据模型的含义和思想进行有效的表达,以达到设计思路的体现和传承,保证数据结构的扩展性和适应性,为行业应用的建立打下坚实的基础。

寿险应用命名规范

数据模型除了要有良好的设计,其组成元素的命名同样要遵循严格的规范。正如前文对词根的说明,通过一定的约定规则建立的词根,能够清晰准确地反映出领域中的信息。数据库中的表名、字段名等信息的命名规则同样是为了保证数据模型表述的信、雅、达,所描述的业务概念的准确和清晰。

首先,数据库中各数据元素的命名必须源于词根,必须遵循词根的约束规则。其次,数据库中各元素需要在词根的基础上进行扩展和重新组合。词根作为一套行业标准是面向具体的行业领域的,而命名规范在面向行业领域的同时,还要面向应用系统,服务于具体的业务系统,反映与系统相关的信息代码、业务类别、数据类型等,在某些方面还需要与软件代码的命名规范相结合,带有明显的技术特征,这也是词根与命名规范的主要区别。

以寿险核心业务系统的数据库表的命名规则为例,数据库表分为两大部分,一部分是寿险业务的应用表,另一部分是数值表或数据表。

应用表反映数据模型的主体,这些表采用“领域类别+业务类别+业务内容词根+应用类别”的命名规范,其中应用类别是可选的。寿险数据模型的领域代码为“L”,表示寿险领域(Life Insurance)。业务类别中,对于保单明细信息和承保业务,以字母“C”为标志,本文列举的事实表就是承保业务表的示例。此外,对于保全业务,以字母“P”为标志,对于产品描述相关的数据模型,以及业务规则定义的约束表,字母“M”为标志,等等。业务内容词根表示了数据表的具体业务内容或对象。

部分数据库表附加应用类别,表示数据库表的用途,例如用于描述定义的表,需要以Def为后缀。以险种定义表LMInsuProductDef为例,L表示寿险业务应用表,M表示产品描述体系中的表,InsuProduct来源于“保险产品”词根的缩写形式,Def表名这是一个用于定义的表。

数值表或数据表包括费率表、现金价值表等,包含着险种精算要素等与计算相关的纯数据信息,含义明确且单一,因此这类表均以所代表的数据内容的词根缩写为起始,如费率表以rate的缩写RT起始,现金价值表以cash value的缩写CV为起始。之后加上险种的代码和数据表的版本号,作为命名规则。由于险种代码可能是数字代码,也可能是字母代码,为了区分方便,数值表的命名规范中使用下划线“_”作为分隔符。例如险种628的费率表为RT_628_1,险种WHI的现金价值表为CV_WHI_1。

挖掘寿险行业软件价值

寿险数据模型设计

基于业务表单进行数据模型的分析和设计是重要的数据库设计思想,其核心是从横向和纵向两个角度对数据对象和数据项进行划分和设计。其中横向分析面向领域的通用性和一般性,形成数据结构中的维度表(通用关系型库结构类)和代码表(代码/单元素库结构类),是对领域的概括和抽象; 纵向分析则针对具体的业务内容,形成事实表(记录事实型库结构类)和约束表(约束型库结构类),反映了领域中的具体和依赖。

横向分析

横向分析针对行业领域内的共性的、通用的信息数据,进行提炼和组织,概括了行业内的对象、实体、概念等的属性和对象的取值关系,既反映了取值的事实内容,也反映了约束和边界。

维度表与相关的行业领域是有一定的关联性的,在取值范围和约束规则上具有较强的行业特性,但在行业内是通用的,与具体的业务活动无关,可以跨越不同细分领域,强调在记录事实型和约束型结构中主要元素之间的一些通用的、固有关系的结构,所建立的是领域的概念数据模型。

维度表的建立是概念筛选和细化的过程,首先对领域中的核心对象进行提炼和抽取,筛选出能够代表领域特征的业务对象和业务概念,例如险种、账户等。然后需要进行对象的通用化设计,设计原则有两点: 求同去异、兼容并包,二者相辅相成、又相互制约。求同去异就是保留共性的、一般化的信息,放弃专有的、不确定的信息,然而并非所有不确定的信息都必须抛弃,这样无法涵盖领域的全貌,无法保证模型的完整性,因此需要以兼容并包的思想建立扩展性机制,通过可定制、可描述的方式建立概念模型。由于概念模型对业务模型起到约束作用,因此最后还需要建立取值关系、约束条件和边界信息等。

代码表是对维度表的进一步提炼,抽取出可以用简单的形式如数字、字符表示的单一信息,进行归类汇总后形成的。代码表明确反映的是取值的内容,取值关系是单一的信息内容,而维度表则可能是一组取值信息或只是取值的范围规则,而非明确数值。同时,相对于维度表,代码表与具体行业领域的相关性较弱,很多信息代码是跨行业、跨领域的。

纵向分析

纵向分析是行业应用数据库设计的重点,也是设计思路得以体现的部分。数据模型需要体现领域中的业务活动的相关信息,反映业务事实、业务过程和业务规则,因此纵向表主要包含事实表和约束表。事实表反映了领域中的业务数据模型。事实表的纵向分析的主要内容就是对象的建立、属性的划分和关系的形成,在整理记录事实表单中的所有相关信息的基础上,对信息进行分类,确定信息归属的对象和层次。

事实表单是一个包含了大量实体对象的聚合体,因此需要对这些对象进行分解和精化,进行维度展开。按维度的展开有两种不用的方法: 面分解和线分解。面分解是针对领域中的组合对象进行分解的方法,将对象分解为不同种类的各子对象,分别分析子对象的属性和信息。线分解则是针对领域中的聚合对象进行精化的方法,将对象分解成类别相同,但具备各自特点的不同的子对象。

属性划分的方法参考了领域知识表述的方式,领域知识通常从两个主线进行表述,分别是结构主线和流程主线,分别强调了成果管理和行为管理。因此,属性的划分需要从“空间”和“时间”两个主线逐层展开。空间主线反映的是在某一特定时期或特定状态下,各实体、对象的属性和取值的状况,可以理解为领域信息的静态展现。而时间主线则反映各业务活动的进展过程,主要体现时间信息和变化信息,可以理解为领域内容的动态展现。

以人寿保险行业领域为例,保单明细信息和承保业务过程是最为典型的业务事实,相关数据模型的建立过程充分体现了基于表单的建模方法。图1显示承保事实中保单明细信息的部分数据模型。

约束表反映的是业务对象和业务过程必须遵循的业务规范,以及为满足业务规范所需的活动,是领域中的业务控制模型。约束表包含两类,一是对事实表单之间或表单中元素之间关系的描述,这些关系往往不是简单的静态数据的类型约束或取值范围(这是维度表的职能),而是一组较为复杂的业务规则,反映了在业务过程中的行为准则,是对动态过程中各数据进行演化的约束和控制,例如承保事实中的投保规则。另外,约束表还包含对于业务控制过程的描述,在业务内容中,本身包含对业务事实进行控制和约束的过程,例如承保事实中的核保过程,这些起控制作用的业务过程在数据模型中的体现属于约束表的范畴。

承保过程是保单生命周期的一个组成部分,保单信息模型需要对承保过程中相关环节的信息进行记录,同时根据承保过程中的业务规范和约束型表单建立承保事实的约束表。图2显示了承保业务事实中的部分约束表模型。

寿险数据模型实例

图3显示了人寿保险行业领域保单明细信息部分的数据模型,和相关的约束表、维度表和代码表的实例。保单表作为保单组合体的对应表,包含了保单自身具备的属性和各组合对象的共通的属性,投保人表、被保人表和险种表是组合保单信息的主要对象对应的表,包含了对应在投保人、被保人和险种层面的相关属性信息。

其中投保人、被保人是以客户信息表的数据为基础的,反映了在具体的保单层面,不同身份的相同客户所具有的不同的信息,如地址、客户账户等,客户信息表作为代码表,从个人基本资料层面约束了客户信息的取值关系。险种既是保单的组合元素,同时也是一个聚合体,在数据模型设计时需要从线分类的角度进行细化,险种是责任对象的聚合,责任又是保费对象和保障对象的组合体。

从时间主线看,保单信息模型中的各对象中都包含与生命周期相关的演化信息,例如保单的核保结论、签发时间(承保时间)、险种的有效期、缴费的起止日期和缴至日期、给付保障的领取期间、领取间隔等。

在保单承保业务过程中,必须遵循投保规则和核保规则,相对应地存在这两种约束型表单,因此投保规则表和核保规则表是根据这两个表单建立的约束表,其中通过算法定义和参数化体系,建立可扩展的约束规则描述体系。此外,对于核保业务过程和核保信息,如特约、免责、问题件等,这些都是对保单事实的约束,也是承保业务事实过程中的约束表。

值得一提的是,我们在设计寿险领域的数据模型时,同时参考了其他一些标准化的模型规范,例如ACORD标准的对象模型和IBM的IAA模型等参考模型,而我们的模型是对这些标准化模型的重要补充、完善和发展。

以ACORD模型为例,它以XML方式完整描述了保单对象,将保单作为一个组合对象进行了定义,这与我们的事实表的描述方式异曲同工,但由于ACORD模型是一个通用应用的标准,是一个指导模型,而非一个应用模型。因此从纵向来看,只是定义了领域中的主体对象,或者说描述了领域中的事实的概要,但并没有针对业务实务形成事实的明细和与事实紧密相关的约束。从横向来看,ACORD模型只包含了部分代码的取值范围或取值依据,但没有复杂的领域概念的模型。这些约束关系是具体业务内容中的重点,应在数据模型中得到完善,使得模型能够描述领域中的业务实务,具备实用的价值。

可见,最后形成的模型,可以理解为“蓝图数据库结构”,类似于建筑行业中的设计蓝图,是在参考模型的指导下形成的,是参考模型的下位概念,一方面必须具体、全面地涵盖领域对象和过程的整体,同时能够作为系统设计、构建和实施过程中可操作的依据。

链接

从字典到词根

字典

汇集单字,并按某种查字方法编排,为字词提供音韵、意思解释、例句、用法的工具书,字典以单个的字为收录对象,也兼收少量复词。其功能主要体现在: 以沟通为主,帮助对文字的理解及翻译; 以知识为主,针对某事物来寻获知识; 含义需要根据上下文来确定。

术语

术语来源于字典,是各门学科中的专门用语。术语可以是词,也可以是词组,用来正确标记生产技术、科学、艺术、社会生活等各个专门领域中的事物、现象、特性、关系和过程,含义基本明确。比如在寿险行业中: 终身寿险(Whole life insurance)、定期寿险(Term life insurance)、生命表(Mortality table)等。

词根

词根是一个行业领域中业务信息表示基础和标准,词根是由术语演化和编排而成,词根的组织和约定必须满足两个基本的要求,一是形式规范统一,二是含义清晰明确,这两点是词根与术语的区别之处。可见,词根比术语具有更强的可操作性,尤其对于行业应用软件的设计和开发工作,由于领域对象的繁杂和变化,在沟通、描述和定义方面必须依据一定的规范或标准,这是词根价值的最大体现。

上一篇:四问无线网络 下一篇:行业应用软件中的词根表和库结构