FRAD概念模型与CNMARC规范控制

时间:2022-09-26 07:27:55

FRAD概念模型与CNMARC规范控制

[摘要]阐述规范数据功能需求(FRAD)的研究背景与概念模型,并比较FRAD与CNMARC规范控制的内容、检索点、著录实体的异同,分析在CNMARC规范控制中实现FRAD概念模型存在的障碍。FRAD为我国制订编目规则、确定标目形式、参照范围以及附注内容等规范提供参考依据。

[关键词]规范数据功能需求 CNMARC 文献编目 规范控制

[分类号]G254.3

1 规范数据功能需求研究背景及概念模型

1.1 规范数据功能需求的研究背景

1999年,国际图联(IFLA)书目记录功能需求(Funetional Requirements for Bibliographic Records,FR―BR)研究小组认为有必要扩展FRBR模式以涵盖规范数据,因而成立了“规范记录功能需求及编码工作小组”(Working Group on Functional Requirements and Numbering of Authority Records,FRANAR)。2003年在意大利举行的International Conference Authority Control国际会议中,FRANAR工作小组新任主席Glenn E.Patton发表了FRANAR:A Conceptual Model for Authority Data一文。2005年5月3日Glenn E.Patton又在OCLC举办的FRBR研究会上发表了FRAR:Extending FRBR Concepts to Authority Data一文,指出“规范记录功能需求”(Functional Requirements of Authority Re―cords,FRAR)概念模式由书目记录功能需求(FRBR)概念扩展而成。FRAR草案在2005年7月至10月全球征求评论之后,经过修订改名为《规范数据功能需求》(Functional Requirements for Authority Data.FRAD),并增加图示及实体关系的范例,工作小组还在2007年4月推出了新草案,并至7月15日截止征求第二次世界性评论。

1.2 规范数据功能需求的概念模型

《规范数据的功能需求》(FRAD)概念模型,扩充和发展了《书目记录的功能需求》(FRBR)概念模型,对FRBR中确定的第二组实体的属性、关系和用户任务进行了系统、全面的阐述,为使规范记录中的数据和规范记录的用户需求相关联,进一步研究挖掘规范数据的功能要求和规范数据跨行业、跨语言、跨国界的使用潜力,提供了一个结构参考框架。

FRAD认为,规范记录实际上是关于实体信息的集合。FRAD概念模型在所定义的实体方面:包含了两组内容:第一组是FRBR所定义的10个书目实体(著作、内容表达、载体表现、单件、个人、团体、概念、物体、事件和地点),此外还增加了一个档案界所关心的实体――家族(姓氏);第二组是根据规范记录特殊的功能需要,将上述实体的“名称”(如:《石头记》)和分配给实体的“标识符”(如:规范控制号“3452310”),记录在规范文档里的“检索点”(如:《红楼梦》)以及决定“检索点”内容和形式的“规则”(如:“标目法”)和“机构”(如:人民文学出版社),共同定义为5个新的实体。我们可以将这第二组实体理解为FRAD所创造的一种新型的逻辑分组实体。

FRAD和FRBR一样,也是描述“实体一关系模式”,只是把焦点放在规范数据的实体上。实体关系概念模式的构建涉及如何辨识出最重要的实体、每一实体的属性以及实体与实体之间的关系。换言之,概念模式的基本目标在于建立迎合使用者需求的资料结构化架构;而FRAR/FRAD概念模式的目的是为规范记录,11所记载的规范数据提供明确的定义及结构,以迎合数据使用者的需求,并协助评估规范数据国际共享及应用。

规范记录必须在控制下建构规范名称及异名,当成个人、家族、团体、作品、表现形式、载体呈现、单件、概念、对象、事件、地点的检索项。

2 FRAD与中文编目规范控制的比较研究

2.1 规范控制内容的比较

规范控制(authority control),又称为权威控制,是为确保标目(检索点的形式)在书目系统中的唯一性和稳定性,而建立、维护、使用规范记录和规范文档的工作过程。伯格在他所著的Authority Work中阐释了规范控制的5个步骤:①建立规范记录;②将规范记录集中形成规范文档;③将规范文档和书目文档连接,形成规范系统;④对规范文档和规范系统进行维护;⑤对规范文档和规范系统进行评估。

在CNMARC的编目过程中,需要进行规范控制,包括4个方面:①编制规范数据款目,并用规范款目编制书目款目;②将规范款目、参照款目和说明款目按照一定的原则组织成规范文档;③将规范文档和书目文档依某种形式连接起来,形成规范书目系统;④对规范文档和书目文档进行维护和评估。依描述对象,规范控制分为名称规范和主题规范。前者包括人名、团体名称、会议名称和统一题名、丛编题名;后者包括规范词汇名称(即主题词表)和非控制词汇或自然语言。具体包括个人名称规范、团体名称规范、会议名称规范、家族名称规范、个人名称主题、团体名称主题、会议名称主题、家族名称主题、课题名称主题、题名主题、丛书题名主题、统一题名主题、作品集统一题名、统一惯用标日、出版规范、分类规范、代码规范(文献类型、国家代码、语种代码、货币代码)等。

FRAD共有16个实体,包括:①来自FRBR定义的10个实体,即著作(work)、表现方式(expression)、表达方式(manifestation)、文献单元(item)、个人(person)、团体(corporate body)、概念(concept)、实物(objeet)、事件(event)、地点(place);②自档案界附加的实体,即家族(family);③新增的5个实体,包括名称(name)、识别码(identifier)、受控检索点(controlled access point)、规则(rules)及机构(agency)。

将CNMARC与FRAD的规范控制内容作比较,我们可以看到,CNMARC的规范控制只限于个人名称、题名主题、出版规范等的规范控制,书目实体关系是平叫化的;而FRAD打破了图书编目的规范控制界限,还包括档案界的实体等16个实体,建立了一种多维的书目实体关系,可根据用户需求,既能反映单个资源,也能反映特定层面的全部资源,而且这种资源不再限于印刷出版物,而是囊括了所有的已知文献资源类型,书目实体关系是一种树模型。

2.2 FRAD与CNMARC检索点的比较

FRAD的检索点用于查询书目记录与规范记录。书目记录的检索点包括:①作品(work)、内容表达(ex―pression)或载体表现的题名以及作品创作者的名称;②作为创作者的团体;③其他附加检索点。规范记录的检索点包括实体名称的规范形式以及变异形式。CNMARC只有标目没有检索点的概念。书目著录的结果是得到具备各种不同目录功能的款目(包括主要款目和附加款目两大类)。主要款目标目的选择涉及单一个人著者、团体、多个著者、题名等4种类型。

FRAD规范文档能够通过更直接的方式控制书目文档中的检索点形式。例如:一个书目文档和规范文档可以在逻辑上连接起来,它是通过嵌入在书目记录中检索点字段的规范号或通过相关数据库中的检索点表连接的。在系统中,书目文档中的检索点的显示可以被自动控制。这种控制通过规范记录控制号或通过检索点表来确保检索书目文档的一致性。书目记录的检索点字段和合适的规范记录之间的控制号或检索点表之间的连接被用来更新书目文档中的规范形式和参考。一个规范文档或检索点表中检索点的简单变化可以引起书目文档中检索点的更新。

2.3 规范控制中著录实体的比较

在CNMARC中,书目记录的元素由字段与子字段进行描述。实际应用时,编目工作者根据编目条例的要求与CNMARC的规定,将每一编目对象的书目信息完整地著录于各宁段与子字段,添加到书目数据库中生成一条结构扁平、互相独立的书目记录。无论是CNMARC的改造或是OPAC显示模式的改变,都需要明确FRAD实体属性与CNMARC规范控制描述元素之间的关系。

在FRAD模型中,实体的描述通过实体属性来实现,它在逻辑层次定义了每一实体的属性。这个实体关系图和实体定义用于表现名称规范记录(个人、家族、团体、地理和商标名称)、题名规范记录(统一题名和集合统一题名、名称一题名规范记录)、主题规范记录(主题标目、词典的术语和分类标记)和各种标识符的规范记录(国际标准编号、编码等)。然而,实体属性的详细分析及关系重点表现在以下两方面:①与个人、家族、团体相联系的图书馆名称标目的规范记录;②与作品、内容表达、载体表现和单件相联系的名称题名和题名标目。

有关资料显示,在FRBR所定义的98个实体属性中,能与CNMARC的字段匹配的有88个,匹配率为90%,无法匹配的有10个。因此,FRBR实体属性与CNMARC的描述元素具有基本的一致性。而FRAD共有16个实体,除了包含FRBR的10个实体外,还包括家族(family)、名称(name)、识别码(identifier)、受控检索点(controlled access point)、规则(rules)、机构(agency)6个实体。笔者就此6个实体与CNMARC的描述元素进行比较,结果如表1所示:

FRAD新增的6个实体在CNMARC字段里基本上是可以匹配的。由此可见,FRAD实体属性与CNMARC的描述元素具有基本的一致性,可以在CNMARC里实现FRAD的用户任务。

3 CNMARC中实现FRAD概念模型的障碍

CNMARC与FRAD在实体描述上具有很多匹配的字段,理论上为FRAD模式在CNMARC中的实现奠定了基础。但由于两者无论在规范控制的内容、检索点的控制上都具有较大的差异,因此在实际过程中还存在一些可操作障碍。

规范控制的最终目的在于通过建立规范文档,将规范文档与书目文档连接,从而实现对书目文档的检索控制,实现书目功能需求。

3.1 编目层面上的实现障碍

FRAD认为,规范记录实际上是关于实体信息的集合。从“FRAD的概念模型”中可以看出,一个人可能与多部著作相关,一部著作可能关联多个人;一个书目实体可能有多个名称,一个名称可能对应多个书目实体;一个书目实体可能与多个标识符关联,而一个标识符只能对应一个书目实体。

首先,作品层“作品题名”的提取目前在CNMARC中就存在一定的难度。FRBR目录改变了以往每个书目记录孤立存在的状况,而是建立起以作品为核心的一组记录,可以整合同一作品的不同的内容表达和载体表现。这种结构的改善需要统一题名规范标目的跟进才能实现。而在《中国文献编目规则》(第二版)中《标目法》对“统一题名的选择和标目形式的确定”规定为“当同一种文献的不同版本或译本具有不同题名形式,应根据文献的不同情况及实际需要选取其中著称或常用的题名形式为统一题名”,在《新版中国机读目录格式使用手册》中也有对500统一题名的字段内容注释:“统一题名应按建立记录的机构所采用的著录条例记入。不同的机构在统一题名的使用上出入较大。即使用相同的编目条例也是如此”。FRAD把统一题名作为必备检索点,对标目形式的选取也有详细的规定。

3.2 标目原则不统一的障碍

目前,中文编目规范主要采用国家图书馆组织编写的《中国文献编目规则》(第二版)和CALIS组织国内相关专家编写的《CALIS联合目录规范控制研讨会文件汇编(征求意见稿》),这两部著作涉及到标目的选取原则、规范记录所采用的格式等内容。但两者在标目的选取原则等方面存在着较大的差距,以外国人中译名称的规范标目选取为例,前者规定:外国人中泽名称应选取著作上出现的中译姓氏、中泽姓名或中译惯用名称为标目的主要成分;后者则确定外国人中译名称,原则上依据《不列颠百科全书》、《苏联百科词典》、《世界人名翻泽大词典》和在编文献中所见形式等先后顺序予以选取。标目选取原则的不同,再加上当前翻译文献出版中“各译各名”的现象非常普遍,于是同一作者有各种中译名,五花八门。缺乏统一、权威的标目原则,给中文规范控制工作设置源头上的障碍。

3.3 我国规范文档发展现状对FRAD用户任务实现的障碍

我国文献编目规范控制工作是从20世纪80年代开始起步的。1989年,国家图书馆根据IFLA制订的《规范款目和参照款目指南》(GAPE)和《UNIMARC规范格式》,开始制订《规范数据款目著录规则》(草案)和《中国机读规范格式》(试用本),并于1991年5月实行。此后,几经修订,《规范数据款目著录规则》(草案)于1997年一分为二,分为《中文图书名称规范数据款目著录规则》和《中文图书主题规范数据款目著录规则》,从而明确了规范控制的名称和主题两种规范数据类型。《中国机读规范格式》(试用本),经过修订于2002年1月23日由文化部审定成为中华人民共和国文化行业标准(WH/T15-2002),并于同年6月1日起开始实施。除此之外,1996年出版了由全国情报文献工作标准化技术委员会和中国图书馆学会推荐使用的《中国文献编目规则》,具体规定了规范档的编制问题。

然而,国内许多大型图书馆管理系统都没有使用或设立规范控制的功能,即使有些馆建立了规范文档,也没有经常维护,这些文档离FRAD所要求的规范文档功能还有很大的差距。

虽然一些图书馆的规范文档与书目文档初步实现连接,如国家图书馆成功实现规范数据与书目数据的挂接,彻底结束了规范数据与书目数据分别建档、长期割裂的局面;CAMS于2003年9月启动规范数据库建设项目,2004年8月建立联机规范控制实验系统,至2005年11月建立了740 297条准规范记录,目前处在建立初始化规范记录,形成实验规范数据文档和实验联机检索系统的建设之中,但都还没有应用于编目实践,因此,我国图书馆规范文档建设现状离FRAD的要求还有很大的距离,还无法实现FRAD定义的用户任务。

4 结语

FRAD不仅是为了帮助用户理解规范文档里的数据与“外部”实体的对应关系,更是为了解决规范数据本身管理的一些关键问题。与FRBR相比,在实体一属性一关系描述的深度和广度上都有了明显的补充和完善。FRAD为我们制定编目规则,确定规范记录中的标目形式、参照范围以及附注内容提供了依据,为建立各种实体关系、参照关系及连接方式提出了解决办法,全面展示了规范数据的检索、识别、控制、关联以及数据管理的功能。

上一篇:藏书家、文献家与文献学家 下一篇:基于ELM的网上信任两阶段发展模型

文档上传者
热门推荐 更多>