2025年5月4日,第二届古代语言处理研讨会(ALP2025)主办的EvaHan2025古汉语命名实体识别国际评测在美国新墨西哥州北美计算语言学年会(NAACL2025)期间举行。本次评测吸引了中国人民大学、武汉大学、南京大学、北京邮电大学、同济大学、澳门大学等13所高校的团队参赛。在我院夏天副教授和杨孟辉教授的指导下,由我院研究生王艺霖、赵群同学与蜜度科技王新凯、杨亚和组成的团队脱颖而出,在三个测试集上均取得了第一名的好成绩。

会议期间,王艺霖同学进行了技术分享与成果汇报,展示了团队的研究成果。

获奖证书

EvaHan2025评测由中国人工智能学会主办,专注于古代汉语命名实体识别的技术评测。自2022年起,EvaHan系列评测聚焦于古汉语处理领域,先后围绕分词与词性标注(2022年)、机器翻译(2023年)、自动标点(2024年),以及本届的命名实体识别任务展开,举行了一系列针对古汉语的研究测评。本届评测公布了《史记》、《二十四史》、《中医药典籍》三个数据集,旨在通过大语言模型及基于BERT的古文预训练模型的应用,推动古籍命名实体识别研究的突破与创新。

团队成员通过开展多轮实验,挖掘词与词之间的语义关联和结构关系,并采用多模型集成策略,显著提升了模型预测的准确率。这一成果为古籍数字化工作提供了有力技术支撑,体现了我院在图书情报与数字人文交叉领域的科研实力与应用能力。