[db:作者] 发表于 2025-11-3 17:34

人工智能“盘活”海量近代史料,给研究者更多灵感

基于深度学习构建知识图谱,借助人工智能(AI)量化分析职官制度,利用大模型分析日记史料中的人物网络与思想变迁……在中国人民大学通州校区日前举办的“智识重构:AI驱动下的数字人文与中国近现代史研究新范式”学术研讨会上,70余位专家学者围绕AI如何深度赋能中国近现代史研究展开对话。
“虽然光学字符识别(OCR)技术已经比较普及,但它对汉语的识别能力,尤其是文献中相对晦涩文意的识别依然有限。今年,国内大型语言模型全面兴起,我们发现一些新工具不仅可以实现对史料的识别、辨认,还能进一步翻译、分类,甚至较为精准地识别手写的档案等。”中国人民大学历史学院教师张燚明说,中国近代史资料浩如烟海,研究者动辄需要花费数年甚至数十年搜集、检索、解读。而借助AI“盘活”海量史料,研究者可以从“找”的过程中解脱出来,将更多精力投入到“读”史中,透视其前所未见的结构、关联与模式,得到更多灵感。

来自多学科领域的学者分享实践成果。中国人民大学历史学院供图 摄影:何静怡研讨会上,来自中国近现代史、计算机技术、图书情报档案学等多学科领域的学者围绕“智能体与中国近现代史研究”“新一代中国近现代历史文献数据库开发”“数字人文的教育实践”三大主题分享了众多实践成果。湘潭大学副教授王晓园分享了自己的尝试,“现存《谭延闿日记》接近7000篇,总字数约259万字。我们先提取原始手稿图像中的文本,经过人工核对形成资料库,再借助AI大模型提取有研究价值的信息,最终获取有效人物数据一万余条,地点数据1000余条,利用模块化社区探测算法进行可视化之后,历史人物在不同时期的社交网络以图表形式清晰立体地呈现在眼前。”
“因为大量历史信息都散落在不同年代、不同类型的史料中,单纯依靠阅读或者关键词检索,如同大海捞针,查找思路也会受限于个人的认知。”华中师范大学硕士生安高怡说,“我尝试将常用的大部头历史资料导入知识管理软件作为专属信息库,利用AI辅助挖掘关键信息,建立自己的工作流。以前至少需要一学期才能梳理完一部史料,现在几天就可以完成系统的整理,并在此基础上做出更多分析和思考。”
“我们可以看到数字人文的实践开始深入到具体的研究场景中。”中国人民大学历史学院院长胡恒表示,史学数据库正在从“资源仓储”向“智能工具”跃迁,人工智能时代的到来,正推动中国近现代史研究经历一场从方法论到认识论的“智识重构”,数字人文的发展也正为学科建设与人才培养注入全新动能。

“智识重构:AI驱动下的数字人文与中国近现代史研究新范式”学术研讨会在中国人民大学通州校区举办。中国人民大学历史学院供图 摄影:何静怡来源:北京日报客户端
记者:金瑶
页: [1]
查看完整版本: 人工智能“盘活”海量近代史料,给研究者更多灵感