随着近二十年信息技术的飞速发展,大中型文物收藏机构和文物主管机构从文物数字化保护角度,组织开展了大量文物数字化采集、加工、存储与利用工作,积累了大量的文物数字资源。在这期间,国家文物局发布了一些文物元数据标准和指导性文件,但大多数文物收藏机构在文物数字资源系统建设中并未完全遵照标准要求规范、统一落实,而是建立起满足本机构管理要求的文物元数据。在大数据时代,数据汇集、共享与交换已成为未来各行业发展的趋势,在这样的条件下,文物元数据标准体系建设便成为当前迫切开展的基础性工作。2014年应国家文物局的要求,正式启动了国家科技支撑计划“文物数字化保护标准体系及关键标准研究”项目,并开展了“文物数字化保护元数据标准研究”课题研究工作,其中可移动文物专门元数据仅是文物元数据标准体系中最基础的部分之一,并开展了绘画、拓片等12个类别的可移动文物元数据规范建设工作。本文将以雕塑类文物元数据为例,介绍并探讨雕塑类文物元数据内容结构及数据测试情况,为今后标准的推广应用与内容完善打下基础。
一、可移动文物专门元数据发展现状
目前国内外文物元数据研究现状各有不同,国外元数据建设更加体系化和多样化,从20世纪90年代陆续发布了C D WA、D C、V R A等多个与文物、资源相关的元数据标准,其中与我国文物元数据关联密切的是艺术作品描述类目CDWA和描述文物的资料内容标准CCO。
而国内可移动文物是国家宝贵的文化财产,国家文物局做为文物保护、管理的监督机构,一直致力于文物基础数据的建设工作。从20世纪60年代起国家文物局就对藏品登记帐及编目卡内容制定了统一要求,藏品总登记帐包括15项,藏品编目卡包括25项”。20世纪80年代后期博物馆开始信息化探索,上海博物馆、南京博物院和故宫博物院等相继开展藏品管理信息系统的建设工作,开始文物卡片数据项设定的研究。2001年之后国家文物局陆续发布了《博物馆藏品信息指标体系规范(试行)》(文物博发[2001]81号)和文物保护行业标准WW/T 0017-2008《馆藏文物登录规范》(修订版WW/ T 0017-2013)。中国国家博物馆在本馆元数据标准建设中,提出了元数据概念模型,提出了7个元数据元素集、60个元素,342个限定元素。以上文物元数据的标准研究都是针对文物整体进行研究的,所设制的数据项、指标项或元素等都是涵盖了文物的所有类别。
2007年北京大学图书馆肖珑、赵亮着手研究文物专门元数据标准化研究,并出版了《中文元数据概论与实例》一书,其中对古籍、拓片、家谱、舆图、地方志等11种中文元数据制定了规范、相关著录规则及中文元数据基本理论的研制。为本课题的研究提供了许多指导和借鉴的地方。
此外2008年,台湾数位典藏与数位学习国家型科技计划与美国盖提研究中心共同合作研究开发中文版的艺术与建筑索引典(AAT Taiwan),为文物元数据规范取值提供了支持。
二、雕塑类文物元数据数据结构及设计原则
文物专门元数据是用来描述某一类文物信息资源的内容、属性及外在特征的元数据。也就是文物本体及文物数字化资源的描述性元数据。本文将以可移动文物中雕塑这一类别为例,阐述雕塑类文物元数据和著录规则的设计原则及数据结构。
雕塑类文物元数据包括可移动和不可移动两部分,本文主要以可移动雕塑类文物为探讨主题。雕塑类文物元数据的制定,严格遵循了《文物数字化保护专门元数据设计规范》、《文物数字化保护元数据 核心元素集》和《文物数字化保护元数据 核心元素应用指南》三个指导性课题研究成果。雕塑类文物元数据的数据结构分为核心元素、雕塑类核心元素和本地个别元素三个层次,每层又设有元素、元素修饰词、编码体系修饰词。其中引用核心元素集中20个核心元素,并在3个核心元素中扩展了6个元素修饰词,创建了2个雕塑类核心元素,共设制22个元素(见表1)。元数据术语定义了标识符、中文名称、英文名称、出处、定义、注释、术语类型、限定、元素修饰词、编码体系应用于、编码体系修饰词、数据类型、版本、语言、频次范围15个属性。同时为雕塑类文物元数据所设制的元素、元素修饰词制定了著录规则,规则中对元素、元素修饰词定义了中文名称、英文名称、定义、注释、著录内容、元素修饰词、编码体系修饰词及其用法、规范文档、必备性、可重复性、著录说明、著录范例12个项目。具体设计原则如下:
针对雕塑类文物特点分析文物本体蕴含的基本信息、特征信息、历史信息、艺术信息以及社会信息,从中寻找客观、共性、个性的元素和修饰词信息,并进行汇总归类,设定元素和元素修饰词。
核心元素是从《文物数字化保护元数据 核心元素集》中引用元素,引用时保持了元素、元素修饰词语义的一致性,其中元素、元素修饰词的中文名称为了更贴近雕塑类文物,可以进行重命名。英文名称是在信息系统对于元素、元素修饰词赋予的唯一标记,因此不能修改。核心元素集是针对整个文物设定的较通用的元素,雕塑类文物元数据的设计可以从中选择适用于本类别的元素和元素修饰词进行引用,但不能自行扩展核心元素集中的元素,可以扩展元素中的元素修饰词。
雕塑类核心元素是在核心元素集之外,设定的具有本类别特点的元素。
个别元素是由文物收藏机构自行设计的个性化元素,雕塑类文物元数据规范不包括这部分内容。如果有扩展,该元素、元素修饰词不能与其他系统或机构进行数据交互。个别元素的设计给著录单位提供了很大的灵活性,可以在核心元素和类别核心元素之外,设制满足各单位需求的元素和元素修饰词。
雕塑类文物元数据的著录要求,对引用的核心元素遵照《文物数字化保护元数据 核心元素应用指南》中的要求进行著录、取值,同时也根据雕塑类文物特点扩展了部分著录细节要求,并列举了示例。
三、雕塑类文物元数据应用初探
雕塑类文物元数据设计的22个元素47个元素修饰词,主要应用于与文物数字资源相关的信息系统建设,最终为跨单位、跨项目、跨系统的数据传输、互操作提供服务。所以应用机构在建立多个资源系统时,应严格遵守规范中的对每个元素、元素修饰词、编码体系修饰词语义、属性和著录规则的设定要求,这样才能达到数据融合、共享与交互的目的。
(一)文物元素设计应用
雕塑类文物元数据针对文物本体设计了文物类型、文物名称等20个元素、数字资源设计了数字对象1个元素,数字对象元素适用于图像、视频、音频、三维影像、动画等多种数字资源的编目使用。
目前大部分文物收藏机构都已建立起文物管理、影像资源、视音频资源等多种类信息系统,对文物元数据的设定每个机构都已形成自身固有的认知和规则,在这样的现状下,如何使规范与实际应用相结合,如何将规范应用到实际中,其实这需要规范建设架构与应用实践之间进行长期的碰撞和磨合。
文物元数据的三层结构,给元数据设计者和应用者制定了很大的空间,设计者设定的元素通用性很强,吸取了以往文物元数据的研究成果和文物编目人员宝贵经验,以及借鉴了国外CDWA、CCO、AAT等标准体系,使此次的课题研究成果能与国外接轨,同时也能在应用单位中落地。
目前雕塑类文物元数据规范已在四川博物院进行了数据试著录,150条文物数据,全部著录的元素/元素修饰词占56%,部分著录的占19%,未著录的占25%,其中相关文物、相关知识两个元素及其元修饰词均未著录之原因在于相关文物是描述与该文物一组或一系列文物之间的关系,相关知识是体现与文物有关联的人物、事件、研究、术语等知识类内容,这两个元素目前并没有已编目数据的支持,因此需要在今后做进一步研究时,逐渐完善著录内容。
(二)系统元数据应用
目前面向文物收藏机构应用雕塑类文物元数据规范有三种情况:一、新建文物资源系统。随着国家对文物保护与传播工作的高度重视与支持,以往未开展文物信息化建设工作的机构可陆续投入系统建设工作。在文物元数据设定中,凡拥有雕塑类文物的可依规范创建专类别的文物卡片模板,设制雕塑类文物元素和元素修饰词。二、新老系统并存的情况。由于新老系统元数据定义不一样,在数据交互过程中,需要建立对应关系或开发转换工具,实现数据交互。三、老系统。老系统无法在原基础上修改元数据结构,所以只能借助系统改造升级时,重新构建元数据。
四、总结
目前文物专门元数据规范建设工作只迈出了第一步,随着规范的推广与应用,文物元数据标准体系应建立起运维机构,长期跟踪维护元数据,定期收集著录单位的反馈意见,和扩展核心元素集和著录规则等内容的需求,以此做好各项规范在后期的内容修改和完善工作。目前文物收藏机构与文物主管机构具备标准建设的人才非常稀缺,希望通过今后的广泛应用不断壮大标准化队伍,为文物数字保护工作做出贡献。