2024年7月25日上午,中国第一历史档案馆(以下简称“一史馆”)举办第五场青年学术沙龙。沙龙以“数字技术赋能档案馆创新发展”为主题,邀请国家图书馆(国家古籍保护中心)研究馆员龙伟,光典信息发展有限公司研究院院长、高级工程师姜瑞强,及一史馆数据处软件管理科科长、信息系统项目管理师娄健到场交流。
沙龙分为主题分享及交流讨论两个环节。主题分享阶段,龙伟老师以“图书馆数据资源的组织与管理”为题,围绕数据产生和深度应用两个方向,分析了“传统图书馆、自动化图书馆、数字图书馆”三个不同阶段下图书馆工作侧重的变化,介绍了智慧图书馆“1个云平台+3个软硬件系统+N个线下实体空间”的总体架构,强调了围绕数据资源全生命周期形成数据标准的重要性。通过东巴文汉文合璧《创世纪》知识库、国家珍贵古籍名录数据库、《永乐大典》高清影像数据库等案例,详细展示了国家图书馆在数字人文、人工智能、数据模型等方面的应用和成效。
姜瑞强老师侧重“数字档案馆建设和数据服务案例分享”,从数字档案馆发展趋势入手,梳理其政策背景、建设标准、基本特征、总体趋势等,分析了浙江省档案馆和上海市档案馆在数字档案馆建设方面的先进经验,并推荐大家关注《全国数字档案馆建设典型案例集》。在此基础上,重点讲解了知识图谱和人工智能技术在档案领域的应用探索。
娄健老师立足一史馆档案数据资源,以“数智化时代档案数据的应用发展前景与展望”为视角展开分析,认为量化史学是历史研究与档案数据应用的最佳契合点,重点介绍其研究路径、数据来源、分析方法等,强调“规律和相关性并不等于因果关系,定量分析要与定性分析结合应用”,并立足数智化时代,阐述了短期数据应用技术的发力点和长期档案工作模式转变展望。
交流讨论环节,龙伟老师总结了“数据为王,数据会极大改变提供服务的方式,数据化、知识化要有专题性的方向选择”等几个关键要点;姜瑞强老师强调了“要做好顶层设计,要重视数据安全,要关注数据质量”;娄健老师则分析了我馆数字档案馆建设的优劣势。大家还就“量化史学”结论的真实性、语料库的低成本建立方式、优质训练语料的标准、版权保护手段等问题展开了交流。
在数字中国的浪潮下,数据成为重要的生产要素。我馆高度重视数据价值,成立数据处统筹数据资源管理应用,激发数据活力。通过本次沙龙活动,我馆青年干部职工深化了对数字技术在图书、档案领域的认识,从政策、技术、实践等多维度、全方位建立了体系化认知,开拓了数智时代明清档案事业发展的视野。