回溯建库教案(五):中文机读编目格式的两大规范 ——国家图书馆中文图书编目格式、中国高等教育文献保障体系(CALIS)联机合作编目格式
上一节课,我们大致了解了什么是MARC数据,MARC数据长的什么样子,在图书馆配市场中起什么作用。在此基础上,我们来聊一聊中文编目格式的两大规范,国家图书馆中文图书编目格式(以下简称“国图”)、中国高等教育文献保障体系(以下简称“CALIS”)联机合作编目格式。
在这之前,我们看一下,为什么中文机读编目格式会有两种不同的规范?
既然都是规范,产生差异一定是参照不同著录规则和标准造成的。那么全国联合编目中心(国图)和CALIS在编目规则上到底有哪些分歧?王松林教授认为CALIS编目体系属于“学院派”,而全国联合编目中心的编目体系属于“实用派”。前者的著录规则和MARC格式的规定,大部分可以在国际标准书目著录(ISBD)和UNIMARC中找到依据;而后者的文献著录规则和MARC格式的规定,则更多考虑了中文文献的特点。两者其实都遵循ISBD的基本原则,只是细节上略有出入。
至此,你可能看的有点糊涂了。MARC还没有搞懂,又出来一个ISBD、又CALIS。到底是什么东东?
没关系,让我来帮你捋一捋。MARC指的是机读编目格式标准,也就是我们上一节课提到的001字段、005字段、010字段等等,一直到905字段那些由机器来识别书目信息的一种格式,就类似我们经常使用的WORD、EXCEL,MARC数据的后缀名通常是“*.ISO”、“*.MRC”、“*.MARC”等等。这种格式的文件同WORD、EXCEL一样,需要有专业的软件来编辑、保存。MARC机读目录是图书馆书目数据处理自动化的基础。可以用来辅助图书馆的文献采集、编目、流通等工作;编制和生产目录卡片、联合目录、新书通报及其他目录索引;开展书目信息检索和参考咨询服务;还可以进行地区间和国际间的书目信息交换,实现资源共享。
实际上,最早的MARC标准并不是由国际图联制定出来的,而是由美国人G.W.金等人发起,联合加拿大图书馆等16个国家制定了MARC-Ⅰ格式,后来又逐渐演变为美国国会图书馆的USMARC和加拿大图书馆的CANMARC。在此基础上,MARC21由两种相似格式,再排除相异性而形成。到80年代末,已有英国、联邦德国、法国、丹麦、意大利、挪威、瑞典、澳大利亚、日本以及拉丁美洲和非洲共20多个国家和地区进行了机读目录的研究和开发,建立了机读目录系统,生产和发行机读目录产品。在这个过程中,1977年国际图书馆协会和机构联合会还主持制定了《国际机读目录格式》(UNIMARC)。中国国家图书馆即北京图书馆于1987年开始了中国机读目录的开发工作,1991年1月正式发行机读目录。直到1998年CALIS管理中心由教育部牵头,开始建立,总部设在北京大学,在完善“九五”期间中国高等教育文献保障系统(CALIS)建设的基础上,到2005年底,初步建成开放式的中国高等教育数字图书馆。迄今参加CALIS项目建设和获取CALIS服务的成员馆已超过500家。
有的很多馆配业务人员或者从事多年编目工作的人员经常将MARC和CALIS混为一谈,这是绝对错误的。通常,我们在了解客户需求的时候,需要询问中文编目格式是遵循国图标准还是CALIS标准,这才是正确的表达方式。
我们用几个实例,再来看一下。
那么,最后ISBD这个名词,对于我们应用MARC数据的工作者来说,实际上意义并不大,随便在百科里检索一下,大致了解一下就可以了。
简单说一下,ISBD的中文名称叫做《专著出版物国际标准书目著录》。是国际图联从1969年开始不断研究、修订,直到2002年才算基本稳定下来,2007年国际图联出版了ISBD统一版,将原来包括在各种专门ISBD中的全部资源类型的描述结合成为一个统一版本。这些原来的资源类型其实大致包括:
《国际标准书目著录(总则)》(ISBD(G))
《国际标准书目著录(单行出版物)》(ISBD(M))
《国际标准书目著录(连续出版物)》(ISBD(S))
《国际标准书目著录(地图资料)》(ISBD(CM))
《国际标准书目著录(非书资料)》(ISBD(NBM))
《国际标准书目著录(印本乐谱)》(ISBD(PM))
《国际标准书目著录(古籍)》(ISBD(A))
《国际标准书目著录(析出文献)》(ISBD(CP))
《国际标准书目著录(计算机文件)》(ISBD(CF))
ISBD规定了统一的八大著录项目,其目的在于:
(1)是使得不同来源的数据之间的交换成为可能,以便在一个国家生产的记录可以很方便地被其他任何国家的图书馆目录或其它书目所接受;
(2)有助于克服理解记录的语言障碍,使由一种语言的使用者生产的记录可被其它语言的使用者所理解;
(3)有助于将书目记录转换为机读形式;
(4)促进与其他内容标准之间的可互操作性。
罗嗦了这么多,到底ISBD是干嘛用的呢?简单地说,就是规定了具体信息的获取位置,以便让不同语言、不同标准的MARC数据可以相互识别和操作。比如:
CNMARC的题名与责任者是:
200$a邓小平时代$f(美)傅高义(Ezra F. Vogel)著$g冯克利译
每本书的题名,都要著录到200$a中,第一责任者著录到200$f中,第二责任者著录到200$g中。
CNMARC的出版项是:
210$a北京$c生活•读书•新知三联书店$d2013.1
出版地著录到210$a,出版社到210$c,出版时间到210$d。
与之对应的,西文MARC21,题名、责任者、出版项则是在不同的字段里。
下一节课:回溯建库教案(六):出版社如何服务馆配商和终端客户?
回溯建库教案(四):马克数据(Marc)到底是什么?怎样制作?我能学会吗?
回溯建库教案(三):马克数据(Marc)对于馆配市场到底有什么用?没有马克数据我就不能做馆配了吗?
回溯建库教案(二):我想删个字段。
回溯建库教案(一):先上硬菜:来个能阅读Marc数据的小程序
在这之前,我们看一下,为什么中文机读编目格式会有两种不同的规范?
既然都是规范,产生差异一定是参照不同著录规则和标准造成的。那么全国联合编目中心(国图)和CALIS在编目规则上到底有哪些分歧?王松林教授认为CALIS编目体系属于“学院派”,而全国联合编目中心的编目体系属于“实用派”。前者的著录规则和MARC格式的规定,大部分可以在国际标准书目著录(ISBD)和UNIMARC中找到依据;而后者的文献著录规则和MARC格式的规定,则更多考虑了中文文献的特点。两者其实都遵循ISBD的基本原则,只是细节上略有出入。
至此,你可能看的有点糊涂了。MARC还没有搞懂,又出来一个ISBD、又CALIS。到底是什么东东?
没关系,让我来帮你捋一捋。MARC指的是机读编目格式标准,也就是我们上一节课提到的001字段、005字段、010字段等等,一直到905字段那些由机器来识别书目信息的一种格式,就类似我们经常使用的WORD、EXCEL,MARC数据的后缀名通常是“*.ISO”、“*.MRC”、“*.MARC”等等。这种格式的文件同WORD、EXCEL一样,需要有专业的软件来编辑、保存。MARC机读目录是图书馆书目数据处理自动化的基础。可以用来辅助图书馆的文献采集、编目、流通等工作;编制和生产目录卡片、联合目录、新书通报及其他目录索引;开展书目信息检索和参考咨询服务;还可以进行地区间和国际间的书目信息交换,实现资源共享。
![]() |
图1.MARC历史沿革 |
实际上,最早的MARC标准并不是由国际图联制定出来的,而是由美国人G.W.金等人发起,联合加拿大图书馆等16个国家制定了MARC-Ⅰ格式,后来又逐渐演变为美国国会图书馆的USMARC和加拿大图书馆的CANMARC。在此基础上,MARC21由两种相似格式,再排除相异性而形成。到80年代末,已有英国、联邦德国、法国、丹麦、意大利、挪威、瑞典、澳大利亚、日本以及拉丁美洲和非洲共20多个国家和地区进行了机读目录的研究和开发,建立了机读目录系统,生产和发行机读目录产品。在这个过程中,1977年国际图书馆协会和机构联合会还主持制定了《国际机读目录格式》(UNIMARC)。中国国家图书馆即北京图书馆于1987年开始了中国机读目录的开发工作,1991年1月正式发行机读目录。直到1998年CALIS管理中心由教育部牵头,开始建立,总部设在北京大学,在完善“九五”期间中国高等教育文献保障系统(CALIS)建设的基础上,到2005年底,初步建成开放式的中国高等教育数字图书馆。迄今参加CALIS项目建设和获取CALIS服务的成员馆已超过500家。
有的很多馆配业务人员或者从事多年编目工作的人员经常将MARC和CALIS混为一谈,这是绝对错误的。通常,我们在了解客户需求的时候,需要询问中文编目格式是遵循国图标准还是CALIS标准,这才是正确的表达方式。
我们用几个实例,再来看一下。
![]() |
图2.CNMARC-国图规范 |
![]() |
图3.CNMARC-CALIS规范 |
![]() |
图4.MARC21-西文规范 |
那么,最后ISBD这个名词,对于我们应用MARC数据的工作者来说,实际上意义并不大,随便在百科里检索一下,大致了解一下就可以了。
简单说一下,ISBD的中文名称叫做《专著出版物国际标准书目著录》。是国际图联从1969年开始不断研究、修订,直到2002年才算基本稳定下来,2007年国际图联出版了ISBD统一版,将原来包括在各种专门ISBD中的全部资源类型的描述结合成为一个统一版本。这些原来的资源类型其实大致包括:
《国际标准书目著录(总则)》(ISBD(G))
《国际标准书目著录(单行出版物)》(ISBD(M))
《国际标准书目著录(连续出版物)》(ISBD(S))
《国际标准书目著录(地图资料)》(ISBD(CM))
《国际标准书目著录(非书资料)》(ISBD(NBM))
《国际标准书目著录(印本乐谱)》(ISBD(PM))
《国际标准书目著录(古籍)》(ISBD(A))
《国际标准书目著录(析出文献)》(ISBD(CP))
《国际标准书目著录(计算机文件)》(ISBD(CF))
ISBD规定了统一的八大著录项目,其目的在于:
(1)是使得不同来源的数据之间的交换成为可能,以便在一个国家生产的记录可以很方便地被其他任何国家的图书馆目录或其它书目所接受;
(2)有助于克服理解记录的语言障碍,使由一种语言的使用者生产的记录可被其它语言的使用者所理解;
(3)有助于将书目记录转换为机读形式;
(4)促进与其他内容标准之间的可互操作性。
罗嗦了这么多,到底ISBD是干嘛用的呢?简单地说,就是规定了具体信息的获取位置,以便让不同语言、不同标准的MARC数据可以相互识别和操作。比如:
CNMARC的题名与责任者是:
200$a邓小平时代$f(美)傅高义(Ezra F. Vogel)著$g冯克利译
每本书的题名,都要著录到200$a中,第一责任者著录到200$f中,第二责任者著录到200$g中。
CNMARC的出版项是:
210$a北京$c生活•读书•新知三联书店$d2013.1
出版地著录到210$a,出版社到210$c,出版时间到210$d。
与之对应的,西文MARC21,题名、责任者、出版项则是在不同的字段里。
下一节课:回溯建库教案(六):出版社如何服务馆配商和终端客户?
回溯建库教案(四):马克数据(Marc)到底是什么?怎样制作?我能学会吗?
回溯建库教案(三):马克数据(Marc)对于馆配市场到底有什么用?没有马克数据我就不能做馆配了吗?
回溯建库教案(二):我想删个字段。
回溯建库教案(一):先上硬菜:来个能阅读Marc数据的小程序