2023年10月21日,人大信管·求是讲坛——“人工智能赋能下的中国数字人文发展与思考”学术沙龙在北京成功举办。本次沙龙由中国人民大学信息资源管理学院牛力教授召集,中国人民大学信息资源管理学院梁继红教授主持,中国人民大学信息资源管理学院院长刘越男教授出席,邀请了数位国内数字人文领域的知名专家,共同探讨“人工智能赋能下的中国数字人文发展与思考”这一重要话题。

首先,梁继红教授依次介绍了沙龙出席的专家及报告主题,各位嘉宾包括敦煌研究院夏生平研究馆员、吉林大学商学与管理学院张卫东教授、上海大学文化遗产与信息管理学院周林兴教授、中山大学信息管理学院陈涛副教授、北京大学信息管理系王军教授、中国人民大学信息资源管理学院贾君枝教授。

夏生平研究馆员做了题为《敦煌莫高窟文化遗产数字化保护——数字敦煌》的报告,从敦煌莫高窟的历史价值、艺术价值、社会价值和科技价值讲起,探讨如何让这些珍贵世界文化遗产永久性保存和永续利用的问题。夏研究馆员分享了“数字敦煌”综合服务平台的体系架构,作为集数据采集、加工、永久存储和信息共享的综合服务平台,“数字敦煌”的建设目标是以敦煌石窟数字化二十多年的成果为基础,对已有的和将来生产的海量数字资产管理与利用进行整体规划、系统构建、知识挖掘、智慧服务。目前,该项目已经实现了多项文化遗产数字化保护技术成果转化,并为推动流散海外的敦煌遗书等文物的数字化回归,实现敦煌文化艺术资源在全球范围内的数字化共享,做出卓越贡献。

张卫东教授的报告题目为《大语言模型在数字文化资源开发中的应用与趋势》,首先介绍了大语言模型的发展历程、构建流程、核心优势以及发展趋势,提出实现通用人工智能的最终形态是多模态。其次,张教授重点阐述了其在文化生产领域、文化消费领域、文化传承领域的应用及未来趋势,认为大语言模型可以用于文化内容的推荐和个性化定制,为用户提供个性化的文化体验,还可以透过历史文物的残卷、残片复原出历史全貌。最后介绍了大模型在数字文化资源开发中的挑战与应对策略,并阐述了如何提升对于大模型应用过程中研究人员和用户的数字素养。

周林兴教授分享了《数字人文:为档案价值认知转型打开了一扇窗》这一报告,以身边的案例为引,从档案数据总量、档案数据个体的角度分享了数字人文在档案价值认知转型中的重要作用,认为档案数据的精减或进行所谓的价值判定,在很大程度上是在对档案数据完整性的破坏,极大地破坏了档案数据生态系统,不但没有使档案数据的证据价值得到强化,反而是对档案数据的证据价值的弱化,因此提出档案价值是负载于档案的一种社会关系,并介绍了档案价值“漏斗”模型。

陈涛副教授详细报告了《文化遗产多模态数据知识统一表示模型探究》,用多个案例引入介绍了AIGC、多模态AI以及生成式AI应用蓝图,从多模态表示学习、多模态对齐、跨模态生成模型三个方面介绍多模态常见研究问题,并介绍了N-ary文化遗产多模态数据知识统一表示模型的构想,该模型以资源描述框架(RDF)为基础,依据文本、图像、音视频、3D模型等各模态之间的内容特征,同时结合多模态预训练语言模型的表示学习能力,扩展出时间(R)、区间(L)、空间(G)和时序(T)等特征表示元素。该模型的目的是增强模型的跨模态内容(知识)的表示能力,打通各个模态之间的描述障碍,使得模型逐步标准化。

王军教授的报告题目为《大模型时代的智能文献学》,在ChatGPT兴起的大背景下,探讨了大模型时代智能文献学的现状及发展趋势,当人工智能的处理能力已经深入到内容层面后,人机协作模式也从传统的文本驱动转向数据驱动模式,开展细粒度的知识抽取与分析,提供智能文献服务。王教授展示了团队目前多元化的文献开发工具与成果平台,比如自主开发的“吾与点古籍自动整理平台”,已经实现了对古文的自动标点、实体识别、关系识别等功能,并支持自动生成知识图谱。

贾君枝教授以《数字人文领域中知识组织伦理风险探究》为题,从风险识别、风险溯因、风险规避进路三个环节介绍了数字人文领域中知识组织的伦理风险。知识组织在主体、客体、情境和技术四个方面表现出差异化的伦理风险,例如在客体层面,知识表征与表达的伦理风险主要包括术语命名表达、术语间关系和分类失范三个方面,每一方面下又具体包含不同的伦理风险,包括性别、阶层、种族、民族和语言等问题,该类风险主要存在于各类分类表及主题词表、名称规范文档及其分类编目中。

最后,牛力教授对本次沙龙进行了总结发言。沙龙的六位专家分别就数字人文领域的前沿探索、伦理性问题、技术应用以及未来趋势等议题发表见解,为人文资源与技术的融合提供了深刻的思考和启发,在人工智能的助力之下,数字人文研究也正在经历由资源数字化走向知识智能化的转变。

本次沙龙为数字人文研究领域提供了一个崭新的跳板,为未来的合作和探索提供了坚实的基础,将有助于数字人文领域朝着多模态、多技术、多交叉的方向进一步拓展。