科研成果
-
基于多级模糊综合评价法的珍贵历史文书残片修复方法比较——以西域文书为例
西域文书是非常珍贵的历史档案,文书残片修复是整理、保存及利用的前提和保证。修复方法的评价和选用是文书残片修复的核心和关键。国内外对于特别珍贵历史档案修复持非常谨慎的态度,也缺乏相应的理论研究。国家图书馆、旅顺博物馆、新疆博物馆、中国人民大学博物馆馆藏相同性质的文书,分别先后采用不同方法开展西域文书残片修复。针对上述4个馆藏单位不同的残片修复方法在技术方法、材料选择、修复效果与功能等方面展开比较;结合多级模糊综合评价方法对4种修复方法进行定量化研究。研究表明:“修补+开窗镶”兼顾修复、保存、利用等功能,从可实施性和修复后效果两个综合指标得出“修补+开窗镶”的方法最佳,“镶接技术”“册页装订”和“纸浆修补”次之。
-
中国特色档案学基础理论体系的历史发展与当代构建
中国档案学基础理论的发展经历了初创期、发展期、成型期三个主要时期,在不同的历史时期具有鲜明的时代特点,基本特征主要体现在本质属性、对象与范围、方法等方面,核心理念主要体现为党的领导、国情见证、文明印记、话语依托四个方面。中国特色档案学基础理论体系的当代构建,有利于进一步发展和传承档案学基础理论的中国特色,着力构建面向新时代的档案价值论,发展面向中国本土的档案学支柱理论,构建面向人文复兴的数字人文理论,构建面向2035年远景目标的档案信息理论,构建面向新时代治国理政的档案治理理论。
-
Predicting multiple types of traffic accident severity with explanations: A multi-task deep learning framework
Predicting traffic accident severity is essential for traffic accident prevention and vulnerable road user safety. Furthermore, the explainability of the prediction is crucial for practitioners to extract relevant risk factors and implement corresponding countermeasures. Most extant research ignores the property loss severity of traffic accidents and fails to predict different levels of death and property loss severity. Moreover, while the explainability of traditional models is easy to achieve, an explainable design of deep neural network (DNN) is extremely deficient in existing research. Few attempts that incorporate neural networks suffer from the lack of multiple hidden layers and the negligence of structural information when explaining predictions. In this study, we propose a multi-task DNN framework for predicting different levels of injury, death, and property loss severity. The multi-task and deep learning design enables a comprehensive and precise analysis of traffic accident severity. Unlike many black-box DNN algorithms, our framework could identify key factors that cause the three types of traffic accident severity via layer-wise relevance propagation, which generates explanations based on the structure and weights of DNN. Based on the experiments conducted using Chinese traffic accident data, our proposed model predicts traffic accident severity risks with good accuracy and outperforms state-of-the-art methods. Furthermore, the case studies show that the key factors provided by our framework are more reasonable and informative than the explanations provided by baseline methods. Our model is the first multi-task learning model and the first DNN-based model for traffic accident severity prediction to the best of our knowledge.
-
Interpretable video tag recommendation with multimedia deep learning framework
Tags help promote customer engagement on video sharing platforms. Video tag recommender systems are artificial intelligence enabled frameworks that strive for recommending precise tags for videos. Extant video tag recommender systems are uninterpretable, which leads to distrust of the recommendation outcome, hesitation in tag adoption and difficulty in the system debugging process. This study aims at constructing an interpretable and novel video tag recommender system to assist video sharing platform users in tagging their newly uploaded videos.,The proposed interpretable video tag recommender system is a multimedia deep learning framework composed of convolutional neural networks (CNNs), which receives texts and images as inputs. The interpretability of the proposed system is realized through layer wise relevance propagation.,The case study and user study demonstrate that the proposed interpretable multimedia CNN model could effectively explain its recommended tag to users by highlighting keywords and key patches that contribute the most to the recommended tag. Moreover, the proposed model achieves an improved recommendation performance by outperforming state of the art models.,The interpretability of the proposed recommender system makes its decision process more transparent, builds users’ trust in the recommender systems and prompts users to adopt the recommended tags. Through labeling videos with human understandable and accurate tags, the exposure of videos to their target audiences would increase, which enhances information technology (IT) adoption, customer engagement, value co creation and precision marketing on the video sharing platform.,The proposed model is not only the first explainable video tag recommender system but also the first explainable multimedia tag recommender system to the best of our knowledge.
-
论北京奥运档案的遗产价值
对奥运档案价值的传统解读,囿于档案学和体育学的学科束缚,缺乏深刻、全面、系统认知。奥运档案价值再构是将其置于整个奥运遗产框架的宏观视野下进行价值分析,聚焦于其遗产价值。结合档案的基本特性,以及奥运遗产的效益渗透、影响广度和周期跨度,从要素维(内容—载体)、地区域(中国—世界)、领域层(体育—超体育)和时间线(夏奥—冬奥)视角分析北京奥运档案遗产价值的多重衍生表现,构建北京奥运档案遗产价值的双维双域双层双线延展性框架;进而,提出"内容—载体"的开发利用、"体育—超体育"的跨界融合、"夏奥—冬奥"的联动整合的北京奥运档案遗产价值实现路径。
-
存款保险、市场竞争与银行经营稳健性
本文基于银行存款市场空间竞争模型,探讨存款保险制度的实施效果和福利效应,及其与市场竞争政策的交互作用。研究表明,政府隐性担保尽管能够保障存款人利益,但会降低存款人对银行经营稳健性的要求,使得银行追求高风险高收益资产从而降低经营稳健性;而市场化的存款保险制度通过费率与风险挂钩的激励机制,能够有效提升银行经营稳健性,同时避免过高政策成本负担,实现较高的社会福利水平。随着市场竞争强化,引入风险差别费率保险制度,在提升银行经营稳健性和增进社会福利方面的效果逐渐增强。模型分析表明,当长期允许机构自由进出市场时,政府强化竞争政策短期可能降低银行的经营稳健性,但长期内高风险银行逐渐退出市场而更有效率的低风险银行进入市场,这种柔性市场退出机制使得银行业整体经营稳健性增强。因此,在金融市场中强化竞争政策,推行并完善当前市场化的风险差别费率存款保险制度,长期内有助于在保护存款人利益的同时,提升银行稳健性和社会福利。
-
不完全信息下国企混改对市场竞争的影响—基于限制性定价的博弈研究
文章基于不完全信息下限制性定价博弈模型,考虑民营企业为在位者和混合所有制企业为潜在进入者的市场结构,探讨混合所有制市场结构对企业限制性定价策略的影响,以及福利最优的混合所有制改革程度选择.研究表明,随着混合所有制企业中非公有资本比例的提升,限制性定价出现的范围会逐渐缩小;且当市场进入成本较小以及在位企业为低成本类型概率较小时,市场将出现分离均衡,反之将出现混同均衡.分离均衡下存在唯一最优的非公有资本比例,该比例低于无限制性定价基准模型的情况,并随着在位企业为低成本类型概率的增加而进一步降低.因此,文章建议政府在混合所有制改革中综合考虑信息结构和市场成本等因素,同时重视市场主体经营策略的动态调整.
-
数智赋能:信息系统研究的新跃迁
在大数据和人工智能技术飞速进步及其与社会经济活动的融合持续深化的同时,数据治理、高阶智能以及数智赋能正在成为数字经济发展的关注焦点,进而引发信息系统研究的新跃迁。本文首先刻画了我国信息系统研究的阶段演化框架,讨论研究的"造"与"用"视角、主题跃迁、价值创造特点、方法论范式等。接着,通过凝练对于大数据的认识、揭示管理决策要素转变,探讨了现阶段信息系统研究的若干前沿方向,包括"大数据驱动"研究方法论范式、智能方法创新、人机融合行为等方面的研究进展,并概述了相应的建模思路和求解路径。最后,从数据、算法、赋能的层面,阐释数智化新跃迁的新特征、新挑战、新课题,以期为我国信息系统学界提供前沿探索和研究创新的启发。
-
基于三态视角的档案描述标准特征及演进脉络分析
档案描述是档案资源管理的关键问题。随着档案对象从模拟态到数字态再到数据态逐步演进,所需档案描述标准也发生相应变化,建立描述标准与档案对象态别之间的匹配关系变得尤为重要。以档案态别为视角,对模拟态、数字态、数据态对象分别对应的档案描述标准进行了梳理,提出了不同态别档案对象所需描述标准的功能定位和技术路线,呈现了描述标准随档案对象态别同步演进的发展脉络,并对三态并存状况下档案描述标准的开发和利用提出了建议。
-
“老字号”档案在用户品牌决策中的认同功能及实现原理
在与社会互动的过程中,档案的价值日益受到关注,档案在身份认同和群体认同中的重要作用成为相关领域学者的共识。此外,基于社会认同衍生出的品牌认同理论认为,人们通过品牌消费寻求群体归属和身份认同。通过对档案认同和品牌认同理论的挖掘与综合运用,以及利用"老字号"品牌档案进行控制实验,可以构建并验证"老字号"档案对消费者品牌认同的影响机制。研究发现:档案可以强化消费者"老字号"品牌认同,品牌真实性在认知需求的调节下发挥了部分中介作用。因此,强化"老字号"品牌认同可以成为档案资源开发利用的有效路径之一。
-
人物事件导向的多模态档案资源知识聚合模式研究
档案知识聚合作为档案领域构建多维度、跨媒体知识体系的新方法,为多模态名人档案资源的知识挖掘与利用提供了一个新的思路。通过分析名人档案资源特征,从总体方法论角度设计基于语义的档案知识聚合模式,模式设计整体分为资源采集模块、本体构建模块、关联聚合模块和知识服务模块四部分,从确定资源内容、本体模型构建到知识服务类型对如何实现底层多模态档案资源的知识性聚合展开方法过程探究。最后以吴宝康名人档案资源为例进行实证性研究,证明模式设计的科学性与实用性,进而为档案知识聚合研究提供一定的理论基础与发展路向。
-
文档数据化:概念、框架与方法
数据价值已经得到社会各界的高度认可。为进一步利用大数据、人工智能等技术释放数据的价值,文档数据化的概念被提出并日益受到重视,也成为图书情报与档案管理学科数字转型的新领域。经多学科概念与方法的综合和推演,本文对文档数据化的概念内涵、内容框架和关键方法展开系统研究。研究发现,文档数据化是面向文档的开发利用,将文档转变为机器可识别、可分析、可计算的数据的过程;智能技术允许机器参与到文档数据化的决策过程中,使得文档数据化呈现出人机协同、利用驱动、粒度细化、面向计算的特点。基于以上研究,本文提出文档数据化的任务框架,包含转录识别、描述增强、关联构建和矢量处理四项任务,呈现出结构化、语义化和智能化三个维度上面向机器的演进机制。对各项任务涉及的基础方法和关键方法进行梳理后可知,以深度学习、自然语言处理等技术为核心的文档数据化方法正在发挥越来越重要的作用。
-
走向文本的历史档案数字整理:历史追溯与时代转型(下)
数字人文是现代信息生态下解决历史档案因数量庞大以致人力无法逐件式地深入文本内容的因应之道。它对于历史档案整理的根本性影响,是推动时代转型并助力建立历史档案数字整理新范式。历史档案数字整理是层累地生成的数字文本系统。它由四个层次的数字文本组成,即文本阅读的基底层、元数据搭建的桥梁层、文本内数据化的加工层,以及数据分析和可视化的知识发现层,其中第二、三个层次的元数据、标记与注释等数据的结构化整理是实现知识发现的关键。"集成""互动"与"追问"是历史档案数字整理的核心理念。
-
走向文本的历史档案数字整理:历史追溯与时代转型(上)
作为现代学科,档案学与历史学两者之间有着直接的渊源关系。现代历史学是从阅读和利用档案开始的,而历史档案整理尤其受到19世纪历史主义等史学思潮的影响,并以此为思想动力,从中发展出档案整理的经典理论,即来源原则。立足于数字人文推动下历史档案整理的时代转型,通过对历史档案整理理论和实践的追溯,尤其以德国布伦内克自由来源原则为分析重点,得出历史档案整理走向单个文本并将历史档案整理视作历史解释的理论指向,以及史学研究对历史档案文本作细化描述的利用需求。但在历史档案整理实践上,由于档案数量庞大,深入文本的理想及对文本内容的细颗粒描述,不得不因条件制约而止步。这是中外历史档案整理史上曾面临的共同困境,而必待时代孕育新的突破。
-
资源描述中的词表重用类型与实现方式
为提高资源描述的规范化及标准化,提升资源之间的互操作能力,各类型词表不断被创建及使用,词表重用已成为资源描述中的关键问题。本文从资源描述的基本结构出发,基于数据模型和资源标注两个阶段对词表层、模式层及数据层进行详细分析;探讨词表层、概念层两种重用类型,认为当前用户更关注于词表层重用,概念层重用将随着词表生态环境的完善得到进一步发展;以数据模型中的类与属性为划分对象,以RDF三元组形式入手对词表重用实现方式进行深入研究,有助于明确各种方式之间的差异性及适用环境,能够有效地指导用户运用已有词表对数据集的类、属性及其取值范围进行准确描述,从而提升数据集的质量。
-
A temporally dynamic examination of research method usage in the Chinese library and information science community
In this paper, we discuss how research methods are used in the Chinese library and information science (LIS) community, a fundamental question in the pursuit of a global overview of this interdisciplinary research domain. We used manual coding to identify research methods mentioned in 2,421 Chinese-language papers written by 53 prestigious Chinese LIS researchers across different generations. For all selected publications, we manually identified and classified methods using a modified version of an established classification scheme for LIS research methods. Moreover, we examined how research methods are used by researchers belonging to different age groups over time. We identified a significant shift in the use of methods among examined publications: quantitative methods are increasingly used over time, driven both by the emergence of newer generations of researchers and by senior researchers gradually adopting newer methods. These findings reflect a major, and heretofore undiscussed, shift in research style in the LIS community in China. Our approach facilitates a new, more dynamic discussion of how research methods are adopted in a research community and will greatly contribute to future studies on this topic.
-
Hotness prediction of scientific topics based on a bibliographic knowledge graph
As a part of innovation in forecasting, scientific topic hotness prediction plays an essential role in dynamic scientific topic assessment and domain knowledge transformation modeling. To improve the topic hotness prediction performance, we propose an innovative model to estimate the co-evolution of scientific topic and bibliographic entities, which leverages a novel dynamic Bibliographic Knowledge Graph (BKG). Then, one can predict the topic hotness by using various kinds of topological entity information, i.e., TopicRank, PaperRank, AuthorRank, and VenueRank, along with pre-trained node embedding, i.e., node2vec embedding, and different pooling techniques. To validate the proposed method, we constructed a new BKG by using 4.5 million PubMed Central publications plus MeSH (Medical Subject Heading) thesaurus and witnessed the essential prediction improvement with extensive experiment outcomes over 10 years observations.
-
服务社会化:《档案法》修订后档案利用服务的新格局
近年来国内外档案工作实践不断强化档案服务社会化的目标和要求,在法律层面确定其定位将影响到国内档案利用服务工作的依法科学开展——我国2020年修订的《中华人民共和国档案法》在档案利用服务方面恰好也呈现出这一基本特征。新《档案法》以权责平衡奠定法律基础,以完善要素制定实践策略,以双向互惠设定长远目标,从三个层面自下而上地围绕档案服务社会化,为我国档案利用服务解决了基本矛盾,提供了实现途径,升华了辩证关系。
-
“十四五”时期我国档案利用服务的机遇、挑战与对策建议
"十四五"时期是我国实现"两个一百年"奋斗目标的历史交汇时期,是实现"建成文化强国,国家文化软实力显著增强"目标的第一个五年规划期。档案资源是国家重要的文化资源,充分开发利用档案资源,为民众提供优质的档案服务,是社会主义文化大发展大繁荣的重要抓手。2021年6月中共中央办公厅、国务院办公厅印发的《"十四五"全国档案事业发展规划》中31次提到"利用",明确指出要"建设好方便人民群众的档案利用体系",进一步提升档案利用服务水平。由此可见,
-
回顾与前瞻:“十三五”档案学科发展调查和“十四五”档案学重点研究领域展望
"十三五"期间,我国档案学科在学科建设、人才培养、学术研究、服务社会、国际交流与合作等方面取得了长足进展,推出了丰富的研究成果,获得了新的更大的发展空间。但在档案学原创性基础理论研究、档案学研究平台、团队与基础设施建设方面仍较薄弱,学科影响力尚需进一步提升。"十四五"期间,我国档案学科仍将关注人文、管理和技术三大研究取向,更注重这三者的交叉与融合,重点对文件档案管理数字转型、档案记忆理论与数字记忆、档案与数字人文、档案社会化趋向与文件档案管理理论创新、文件档案治理、古文书与档案事业发展史、文献遗产保护与修复及档案学专业教育改革与发展等领域开展研究,开创开放、多元、创新的学科新局面。