汉文档案的著录是中国第一历史档案馆的一项重要工作。所谓档案著录,就是对档案主题信息判断、选择、记录的过程。“著”重在标引,是将内容主题的自然语言转化成检索的标准语言的过程。“录”即抄录,是将档案的形式特征如责任者、具文时间等原始信息逐项对照记录。整理后的档案,如果不经过著录流程,不拟定题名,是难以检索利用的。
利用者在信息管理平台通过检索字段定位查找档案信息 |
20世纪80年代对原档进行手工著录 |
自1925年一史馆的前身——故宫博物院文献馆成立以来,老一辈档案人便孜孜不倦地辛劳工作。他们按批次提调原档,逐件审读档案内容,认真提取主题信息,截至2010年,共开放档案检索目录300余万条。
为满足社会不断增长的利用需求,新一代档案人决定在整理和数字化工作的基础上,尝试使用图像著录模式开展档案著录外包工作。利用图像进行著录,首先避免了著录人员直接接触原档,不干扰原档的保护环境。其次,档案图像可以同时被不同的计算机获取,各字段由不同人员分别著录,档案著录不再“一件终身制”。原本手工单件著录只能顺序进行的工序,如今可以同时推进,缩短了时间,提高了效率,方便质检与管理,有效降低了著录差错率。如果说原档手工著录像是比较原始粗放的家庭式作坊的话,外包图像著录模式则像是信息化生产的工业流水线。著录人员根据以往著录经验,将著录流程分割成各项工序,通过编制加工系统软件,设定功能模块,安插专职人员,实现了网络化管理。
项目管理组对外包著录人员进行业务培训
外包著录听起来容易,但是要确保著录的安全性、准确性和完整性,这条流水线的打造可是凝聚了新一代档案人满满的心血。首先遇到的难点便是如何培养著录队伍。清代档案文种繁多,行文字数各不相同,以题本为例,通常由上千字构成,内容具指性不强。初识档案,对于非专业人员来说,简繁字对照尚且存在困难,更别说通读档案、提炼主题了。为了提升外包人员的业务素质,项目管理组开展了清代题本简介、题本主要内容、题本术语、题本相关职官介绍、著录细则解读、主题词标引等专项培训课程,考培结合,边讲边学边用,迅速培养出一支专业化队伍。
每天有3000件档案在各流程中著录流转
著录的关键环节,是拟定档案题名。要为历史档案拟出符合现代检索需要的题名,需要档案著录人员有较为系统的古汉语、历史、文书制度等方面的知识,同时具有准确提取信息、凝练语言的能力。这一方法将传统经验与实际操作有效融合,开创了题名拟定的新模式:首先对档案内容分类整合,制定出不同类型的题名格式;然后训练外包著录人员标引档案主题,围绕人、事、地、时四要素,用对照填空的方式组织语句;加上日常逐一排查纠错,三管齐下,使题名拟定速度和质量稳步提升。
在生产过程中,著录工作不断摸索建立合理的管理操作流程,反复研究软件模块设定和各项功能开发。进一步细化档案主题词、自由词及动词标引规则,将著录条目整合为三类34个字段,先后增加题名标识、主题词自动提取、著录差异比对等功能,将计算机批量解决项目成果问题的能力最大化。各项工序流程趋于完善,著录速度和成品质量维持较高较稳定的水平。
著录实验项目管理组进行现场答疑
清代内阁工科题本著录实验
著录工作始终将质量控制贯穿生产过程,把现场咨询放置在工作链条的最前端,实时在岗在线答疑,持续提供知识补给并形成咨询反馈记录。后端则严格成品数据质检验收,发现问题及时修复,确保质量。
以“馆藏内阁工科题本档案数字图像外包著录实验项目”为例,用145个工作日,共著录条目110222条,差错率为0.5%,档案安全、著录质量和效率全面超越以往。著录实验项目组通过外包,在项目管理、培训组织、软件开发、工序设置、成品验收等各环节采集了大量数据,经过整合和研究分析,为著录工作打下坚实的基础。
如今,档案著录的新模式扩大了专业化队伍,增强了信息化加持,贯穿了流水线式的工序设置,积累了成熟的经验,相信不久的将来,互联网上会出现更多更丰硕的明清档案著录成果!