1月6日,信息资源管理学院国家社科基金项目“新发现的仙居民间历史档案整理研究与数据库建设”课题组在中国人民大学国学馆召开“民间历史档案整理与研究”学术讨论会。来自历史学、语言文字学、档案学、数字人文等不同学科领域的11位专家作主题报告。会议由课题主持人梁继红教授召集并主持开幕式,中国人民大学信息资源管理学院院长刘越男教授出席会议并作开幕致辞,清华大学人文学院历史系阿风教授与北京大学历史系刘诗古副教授分别主持会议。中国第一历史档案馆满文处副处长徐莉研究馆员一行8位专家参加了此次会议。

刘越男院长在致辞中首先对各位嘉宾的到来表示热烈欢迎和衷心感谢。她指出,对历史档案的研究,不仅对于档案学的学科发展具有重要意义,而且对于多学科的交叉研究具有重要价值。她特别表达了对“新发现的仙居民间历史档案整理研究与数据库建设”课题组的支持和对本次会议成果的期待。

台湾大学资讯工程学系特聘教授、台湾大学数字人文研究中心主任项洁作题为“谈民间契约文书的数位化”的主题报告。他首先介绍了台湾历史数位图书馆的概况,包含该数位图书馆的馆藏内容、开发情况与功能。他指出,台湾所存民间契约文书具有种类繁杂、没有保管单位、没有正式的档案层次、分类复杂等特性,可以通过内容处理、建置合适的检索系统,用DocuSky建库等数位化工作对民间契约文书进行处理和分析。他在全文和影像数位化、标记、全文深化、消歧与聚合等方面分享了自己的心得,并指出脉络分析对于民间契约文书研究的重要性。最后,项洁教授特别介绍台湾大学数位人文研究中心研制的个人化数位人文平台DocuSky,介绍了该平台的现况和优势。

此外,项洁教授还作了题为“故宫清代档案系统简介”的专门报告。他首先介绍了故宫清代档案系统的现状,指出数位档案系统应具有三个功能,即能够阅览原有档案脉络,能够以检索获得案件间的多重脉络,能够以件为单位检索、以案为单位阅览。他通过“阅览+后分类”的方式,指出台北故宫博物院馆藏的清代档案是不完整的。他还向各位嘉宾介绍了台北故宫清代档案数位化的进度,特别是数位档案系统的后分类、简目、进阶搜寻、项目页等客制化功能。

上海师范大学中文系副教授、上海师范大学数字人文研究中心副主任王贺作题为“民间历史档案整理、研究和数字化的若干问题”的主题报告。他首先对民间历史档案的整理问题进行讨论,结合档案的来源与性质,分析在档案馆之外、在具体的档案编研工作中,分别如何落实陈垣先生的“档案整理八法”与“秤不离砣”原则。其次,在民间历史档案的研究方面,他指出存在在一个地方的历史档案研究中,看到一件或几件被认为是有价值的档案即展开研究的情况。最后,他从元数据的标引、资源本体的构建、开发数字人文工具、数据整理等方面探讨了民间历史档案的数字化工作的开展路径。

北京大学信息管理系助理教授、北京大学数字人文研究中心研究员位通作题为“数据、研究、应用:何以古籍数字化”的主题报告。他首先介绍数字化在AI技术的加持下,呈现出“数智化”的发展趋势。他分别介绍了古籍数字化的重要性、数字化的步骤、数据库建设的意义、基于数据库建设的深度研究。他指出,古籍数字化有三个建设维度,即数据层的工具支撑、研究层的内容挖掘、服务层的文化产品研发。他着重介绍所在团队的研究成果:一是吾与点古籍智能标注系统,他展示了平台工具的结构化处理、自动句读、实体识别、统计与分析等功能;二是文献溯源分析平台,他介绍了该平台词汇分析功能、句子分析功能,以及浏览书目、复用概况、篇章复用分析等书籍分析功能;三是《永乐大典》高清影像数据库,他详细讲解数据库中的六个板块。最后,他再次从工具支撑、内容挖掘、文化产品研发三个维度,对数智赋能档案研究的方法做出总结。

西北大学文学院在读博士研究生韩志周作题为“基于YOLO网络的契约文书文字智能识别——以西北地区契约文书为例”的主题报告。他首先回顾了现有的契约文书的出版方式,主要有文字转录、拍照扫描、图文对照三种主要方式,进一步指出对繁杂材料进行编排整理、文字识读及转录是快速刊出庞大数量的新材料的基础工作。他从数字人文驱动下的契约文书智能文字识别系统研发之必要性和数字人文背景下的契约文书研究新范式之重要性两方面进行需求分析。之后,他从数据集概况、基于YOLOv5的主干特征提取网络、基于YOLOv5的改进策略三方面介绍了基于YOLOv5的民间手书文字识别算法设计。他还报告了基于YOLO网络的契约文书文字智能识别的实验过程和结果分析,结果发现该算法能够正确识别异体字(俗字)、能够正确识别具有“颜色干扰”的汉字、能够正确识别字体结构缺失的汉字。此外,他还对该算法的准确率、应用场景和后续计划进行了介绍。

辽宁大学信息资源管理学院教授、院长赵彦昌作题为“清代民间档案整理与研究的回顾与展望”的主题报告。首先,他梳理了21世纪以来清代民间档案整理与出版的成就,指出传统民间档案整理工作的问题,表示数字时代的冲击正引发清代民间档案整理的变革。他指出,清代民间档案的种类、内容和保管状况十分纷繁,但相对于清代官方档案而言其利用更自由。其次,他分析了21世纪以来清代民间档案整理与研究的得失。他归纳总结了清代民间档案整理与研究工作的遗憾与不足,并梳理了清代民间档案整理与研究工作的成就。最后,面向未来,他提出了未来清代民间档案整理与研究的可能性,从汇编的数字利用、档案的移动查阅、数据库的建设、清代档案整理与文献整理的互鉴等视角提出期许。

暨南大学历史学系副教授、历史地理教研室主任黄忠鑫作题为“明清徽州赋役合同文书的收集和研究”的主题报告。他介绍了自己对徽州文书的收集情况,分析了赋役合同的类型和内容,指出文书整理的趋势:即越来越注重原始面貌,关注点从县级的大地域,到都图的小地域,再到家户和小包。他认为,赋役合同在三个层面体现出了信息勾连,一是都图村落,二是户名姓氏,三是土地字号。他还对确定赋役合同地域归属的方法、合同散件的拼合、图甲户籍的交易过程等方面的研究作了介绍。最后,他介绍了自己在闽东文书的坐落判定和内容分析方面的研究应用情况。

北京大学中华人民共和国史研究中心暨历史学系副教授刘诗古作题为“鄱阳湖区文书的搜集、整理与研究”的主题报告。他首先分享了自己十年来在鄱阳湖区开展渔民历史文书搜集所经历的悲喜交加的故事,指出田野调查对于民间文书的搜集与研究具有重要意义。接着,他介绍了《鄱阳湖区文书》的整理过程,主要经历了文书进城、修复装裱、文书扫描、大件拼接、整理编目、录文校对等关键步骤。文书的整理、编目与抄录等繁琐工作,是文书研究至为重要的环节,不应因其耗时费力就不加重视。这种文书整理上的“慢”,恰恰可为后续深入系统的研究奠定“快”的基础。他表示,研究民间契约文书,如果仅看文书的内容,文字虽都认识,但有时很难理解其真正的意思,需要研究者进入到当地人的世界,通过亲身的田野调查,不断向当地人询问、请教、感受等方式以增进对文本的理解。他指出,越是深入研究民间文书,越可以发现文书研究与自然、人群、制度、产权、社会等多方面的研究相互关联。

陕西师范大学文学院/语言资源开发研究中心助理研究员郭敬一作题为“西北契约文书选注与研究”的主题报告,报告围绕编纂契约文书入门读本这一设想展开。首先,她从契约文书资料汇编、史学方面的研究、语言文字相关研究三个方面概述了学界的研究现状。她认为,该研究的意义主要表现在以下三个方面:一是探索契约文书整理的新方法,二是提供契约文书研究的新视角,三是搭建契约文书阅读的桥梁。其次,依次从选辑、图录、研究、题解、注释五个方面详细介绍了该读本的主要内容。最后,她还展示了该读本的部分样稿,并与在场各位专家学者就契约拟题、归类、解读等具体问题进行讨论交流。

清华大学人文学院历史系教授阿风作题为“明清社会经济史研究中契约的史料价值”的主题报告。他指出,档案文书是事件发生同步的历史记录,是历史研究的基础史料。诚然,档案文书有很多“虚构”的内容,但“虚构”本身事实上也能够为历史研究提供更多的信息。作为民间档案,契约在区域社会史研究中具有重要的作用,他们不仅有伦理的说教,更反映了生活的实态。透过契约文书,可以了解礼法观念是如何作用于实际的生活。最后,他分享了自己在课堂上讲解契约知识的感受和方法。

河南财经政法大学副研究馆员徐浩作题为“李盛铎等人窃取敦煌写卷的证据”的主题报告。他的研究缘起于对敦煌文书的缀合工作,从卷首的古人点勘、全卷保存状况、断裂方式和千字文分布等角度证明了李盛铎等人有组织地掩盖自己非法窃取敦煌写卷这一史实。他表示,新见档案所见原解经委员武向晨题跋中自述的解京写卷装运细节,也为李盛铎等人为何采用上述撕裂方式提供了重要的文献佐证。

中国人民大学信息资源管理学院教授、项目主持人梁继红作题为“民间契约文书典藏序列中的“包”及其意义释读“的主题报告。她首先就文书与档案的概念使用、官方文书(档案)与民间文书(档案)的范围、官方文书与民间文书的关系等作了基本辨析。之后,她分享了自己在档案学和古文书学视野下对民间历史档案整理的方法论反思,强调了陈垣等学者提出的“不是原来之真相”原则的理论意涵及其延展性,指出“文种分析”对于中国古文书学研究具有方法论意义。她通过对中国文化的大传统与小传统、档案整理的重要性与范式转换、民间文书信息的层累性叠加等方面的相关论述,强调了档案(文书)文本的意义叠加与数字记录的重要性。她探讨了民间契约文书的 “包”及其构成,指出民间契约文书“包”并非为了阅读,其功用在典藏和检核。她用两个案例说明“包”内文件的构成及其可能的复杂性解读问题。最后,她强调了民间历史档案整理研究多学科交流的重要性。

在会议讨论环节,各位专家就民间历史档案整理与研究的理论和实践问题展开了热烈而充分的交流讨论。