中文期刊编目工作内容

时间:2022-10-06 02:15:55

中文期刊编目工作内容

期刊编目工作是图书馆信息资源建设的重要组成部分,书目数据质量的高低直接影响读者的使用体验,是图书馆服务质量的关键指标。期刊每年新编数据不多,编目工作主要集中在旧数据维护上。本文重提数据维护这项传统业务,是因为随着编目规则和国家标准不断更新,数据维护工作的精细化程度也在不断加深,编目员所面临的问题也更加复杂。笔者结合自身编目经验,以国家图书馆中文期刊书目数据为例,谈谈如何发现和处理期刊数据维护工作中的错误,以期对提高数据质量有所帮助。截至2016年6月,国家图书馆中文期刊书目数据共有52868条,其中新中国成立前(1949年以前)出版的期刊数据为15596条,新中国成立后(1949年后)出版的期刊数据为37272条。在新中国成立后的期刊数据中,过刊数据为26611条,现刊数据为10661条,上述庞大的期刊数据都是编目员日常维护的对象,也是本文的数据采样来源。

1错误发现机制

发现错误是解决错误的前提,传统的中文期刊数据错误发现方法是每年进行“地毯式”排查,也就是全面维护。国家图书馆采取的方式是编目员进库提取最新一期的期刊,查看各项出版信息是否发生变化,依据文献的最新数据源来据实更新,最后全面复查数据格式。全面维护时,编目员主要关注编辑部地址、主编、期刊标识号等信息是否发生变化,卷期标识是否发生变化,期刊价格是否发生变化,数据在格式上是否存在错误等内容。“地毯式”排查的优点是准确率高,能全面发现问题。但目前面临的实际情况是期刊出版数量激增,而图书馆编目人员的数量却不可能无限扩张。国家图书馆期刊编目员每月常规维护量为100条,人均管辖期刊1200~2000种,完成一次全面数据维护需要一年的时间。在这个出版物“爆炸式”增长的时代,地毯式排查维护周期过长、数据更新缓慢的弊端日益凸显,已不能完全适应新的出版形势。程序校验,顾名思义就是“用程序进行校对和验收”。结合文献编目工作的实践,可以理解为:根据不同文献载体,结合不同文献的出版特点,根据CNMARC各字段的定义,由文献编目员提出需求,让编程人员做出相应的校对程序,用机器取代人工进行校对。在2013年之前,国家图书馆一直没有通过程序对已有的中文期刊数据进行系统的校验,编目员只能是在工作过程中发现问题再解决问题。2013年为配合“国家书目”的出版,首次采用了程序校验。校验程序包括两个方面:一是校验各字段是否按照《新版中国机读目录格式使用手册》正确著录,二是校验多个字段间的著录是否匹配。中文期刊涉及的主要匹配参数如下:(1)当210$d子字段字节>=9位,100字段第8位非“b”,报错。(2)100字段第9~12位与210$d“-”前出版年不一致,报错。(3)100字段第13~16位与210$d“-”后出版年不一致,报错,但当100字段第8位非“b”且100字段第13~16位为“9999”时,不校验。(4)100字段第8位为“b”,100字段第13~16位为9999,报错。程序校验的优点是能迅速发现错误,筛查出大部分的“硬伤”(格式错误),但由于提出的需求不是针对具体一个对象,而是“一对多”的情况,所以通过程序校验生成的“问题数据”并不是每条都有错误,需要人工逐条查看。此外,程序校验的局限还在于无法发现“软伤”———由于编目员知识更新不及时、编目规则不清楚所造成的错误。

2常见错误解析

国家图书馆通过常规地毯式排查,共发现各类期刊数据错误351条;通过程序校验系统核查,共发现硬伤856处,其中出版地与出版国别代码问题数据742条,期刊格式问题数据114条,现将几类主要错误加以分析。GB/T3792.3—2009《文献著录第3部分:连续性资源》规定:“当连续出版物发生主要变化时,视发生主要变化的资源为新资源,需要另行著录”。因此,是否为“主要变化”,是编目员新编数据正确与否的依据。如果同一正题名下期刊分多个版本出版,一段时间后其中某一版本更换了副题名,按照新标准应新编书目数据。但有些编目员未新编数据,只是在附注字段进行描述。以《湖北教育》为例:该刊1966年创刊,创刊半年之后休刊,于1973年复刊。2002年,该刊按“教育教学”和“政务宣传”两个内容出版,其中“教育教学”一直正常出版,“政务宣传”于2007年更名为“时政新闻”,“时政新闻”又于2009年更名为“综合资讯”。在实际操作中,编目人员将上述样例中的第3、4、5三条数据省略为一条数据,只在3XX字段做附注说明,其错误做法如下:2001#$a湖北教育$i综合资讯304##$a2007年前小标题曾为:政务宣传304##$a2009年no.12前小标题曾为:时政新闻这个错误使得期刊的发展演变关系无法通过数据展示出来,“政务宣传”和“时政新闻”从文献出版链条中消失。按照文献编目规则和新的国家标准,正确维护后的该期刊应该有5条书目数据,关键字段如下:(1)2001#$a湖北教育446#1$12001#$a湖北教育$i教育教学446#1$12001#$a湖北教育$i政务宣传(2)2001#$a湖北教育$i教育教学431#1$12001#$a湖北教育(3)2001#$a湖北教育$i政务宣传431#1$12001#$a湖北教育440#1$12001#$a湖北教育$i时政新闻(4)2001#$a湖北教育$i时政新闻430#1$12001#$a湖北教育$i政务宣传440#1$12001#$a湖北教育$i综合资讯(5)2001#$a湖北教育$i综合资讯430#1$12001#$a湖北教育$i时政新闻再以《青年文学》为例:该刊于1982年创刊,于2003年按分成“A版”“B版”出版,编目人员分别以“A版”和“B版”新编两条数据,并同《青年文学》进行了链接。其中“B版”于2006年停刊,“A版”继续出版一年后于2008年改为无“A版”字样出版,也就是变成了新的“青年文学”(理解为改回原“青年文学”亦可)。按照编目规则,需新著录一条编目数据,但编目员没有进行新编而是更改了2001#$a,其做法如下:2001#$a青年文学207#0$a2003,no.1(2003,1)-=总241-304##$a小标题曾为A版431#1$12001#$a青年文学这种做法使得平行出版的两条数据“青年文学•A版”和“青年文学•B版”无法同时被检索到,检索后只能获得“B版”的数据及馆藏信息,“A版”的相关内容被掩盖了,由“青年文学•A版”再到“青年文学”这一继承关系也未被体现。但由于新国家标准中也提及“若无法确定资源的题名或版本的改变是主要变化还是次要变化,按次要变化处理”,所以后续编目员未对此条数据进行修改。在做频率维护时,常出现的错误是326字段描述性语言与110字段第2个字符不匹配。例如:一个期刊由半月刊改为月刊,编目员只维护了326##$a月刊,但忘记将110的第2个字符由e(半月刊)改为f(月刊)。这个错误只是编目员由于一时疏忽导致的“小硬伤”,但另一类错误更需要值得重视,这类错误多发生在出版混乱的多版本期刊上。这类期刊的出版大致都处于以下状态:刊社一部分版本公开发行,另外一部分版本只针对行业内部发行;刊社自己出现经营困难,在出版自己期刊的同时将刊号交给其他团队运作,而这些团队发行的刊物是非法出版物,不对外公开;国内大多数单位职称评定“论文”是首要硬件,刊社以“”为商机,专门出一个论文集版本,该版本只针对论文作者做定向发行,不对外公开。对于上述期刊,如果编目员对书目数据维护不及时,某一个版本(如下半月或某一旬)会完全缺失。但有时编目员已经明确了期刊的频率,却仍然无法全部入藏所有的版本,面对这种情况,有些编目员在著录频率字段时采取了错误的做法———把本该著录的实际频率著录成了本馆的实际入藏频率,并在3XX字段进行描述。错误样例如下:326##$a[月刊]315##$a下半月非法出版,未入藏正确的做法是依据实际情况客观著录:326##$a半月刊300##$a下半月非法出版编目员不应将入藏情况与编目数据据实著录相混淆。3XX字段虽然可以自由行文,但只是对CNMARC0~7字段的各个著录项目进行必要的补充说明,而不是针对自己所在图书馆的收藏进行描述。2.3出版发行地与地区代码问题人为因素造成的数据“硬伤”在出版发行地与地区代码错误中占有相当大的比例。国内统一刊号著录在091字段,是非常重要的中文期刊标识号。在期刊编目过程中,102字段$b出版地区代码(6位数字,后四位为0000)与091字段$a的地区号(2位数字)在一般情况下应该著录一致,如不一致,即为错误。如《光学精密机械》是吉林长春出版的内部资料,吉林省地区代码为220000,编目员在著录102字段时键入了102##$aCN$b210000(210000为辽宁省的代码);有些则是将期刊的邮发代号前两位著录成了地区代码,如《今古传奇》邮发代号为38-83,在著录102字段时编目员键入了102##$aCN$b380000,而行政地区代码并没有38这个号段;还有的错误是将地区代码后4位“0”直接著录在前面,如《厦门特区党校学报》著录成了102##$aCN$b000035。这些错误均是手误,通过认真检查和仔细校对就可以避免。但有些情况下,102字段$b与091字段$a两者一致却是错误的。早期军队出版的期刊,统一刊号的地区代码均为CN81-XXXX,出版地则分散在全国各地,著录时应按照实际出版地著录地区代码。例如《军队政工理论研究》在上海出版发行,原刊号为CN81-5010,但在著录102字段时,编目人员直接著录102##$aCN$b810000,而按中华人民共和国行政区划简册给出的各省、自治区、直辖市地区代码,810000代表的是香港地区,正确著录应为102##$aCN$b310000。此外,由于期刊出版发行比较复杂,一些文化、经济比较发达的地区号源紧张,用异地刊号出版的刊物越来越多,特别是北京地区已启用了CN10-XXXX刊号,依照格式的相关要求,在著录时CN地区号(10)与出版地的代码(11)也应不一致。期刊出版起止年在期刊编目数据中共涉及3个字段,即:通用处理数据100字段中第9~12位字符出版起始年和13~16位字符出版终止年,卷期年月或其他标识项207字段,以及出版发行项210字段的子字段$d。互观三者,就可以判断著录是否正确。当一个刊物还在出版发行时,这3个字段的相关著录不易出错,但当一个刊物需要做停刊数据维护时,编目员往往忘记修改100字段的出版年2,即第13~16字符还显示为出版状态(9999),或者是207字段已做停刊,而210字段还显示正在出版。例如下条数据:210##$d1993-207#0$a1993,no.2(1993,6)-2007,no.6(2007,12)=总39-113$av.25,no.1(2008,2)-v.31,no.6(2014,12)=总114-157上述著录207字段已做封口处理,表明该刊已经停刊,但210子字段的著录又表明该刊还在出版发行,这就出现了前后矛盾,产生了数据错误。

随着中文期刊非核心业务(拆包分拣、记到加工)逐渐外包,采编人员不能在第一时间接触到期刊,有些出版信息的变化需要记到人员的反馈或者在进库房查刊才能更新。如果前期能够加强记到员的培训,使采编人员和记到人员能够及时沟通,就可以把编目员从繁重的全面维护中解放出来。对于“硬伤”性质的错误,各图书馆可以引入程序校验方式进行批量检查,如上述2.4类型的错误就完全无需人工逐条核查,通过程序筛查可以大大提高数据维护的效率。错误在所难免,但错误产生的原因需要反思。有些错误靠认真检查就可以避免,但有些错误则是源于认知问题,是编目知识更新的不够及时造成的。一个合格的编目员需要数年才能养成,但很多编目员没有系统学习过《中国文献编目规则》及《新版机读目录格式使用手册》等专业书籍,前人著录,后人模仿,形成了约定成俗的著录方式。时代在发展,编目规则和国家标准也在不断地更新,传统的“师傅带徒弟”的编目员养成方式已不能适应现在的编目工作。正如前文所说,期刊每年新增数据不多,大部分工作都是对旧数据进行日常维护。新编数据有审校人员进行把关,但数据维护没有人进行复查。编目员要树立正确的期刊维护意识,变被动为主动,要意识到维护不是简单地见到某一个信息变化就更改某一处,而是应该像编新刊一样各字段逐一核对,对数据进行全面的梳理。只有这样,期刊数据维护才是主动的维护、积极的维护,是对原数据进行一次新的“校对”。

上一篇:社会志愿服务制度建设研究 下一篇:浅谈农业职业培训教材体系建设