首页 > 动态
动态
魏达贤:公共图书馆古籍智慧化阅读模式构建研究—以中华古籍智慧化服务平台为例
时间:2026-03-13 来源:《图书馆学刊》

[摘要]作为古籍收藏、利用与传承的主要场所,公共图书馆在信息技术的驱动下,正推动古籍从传统的数字化阅读向智慧化阅读转变。分析公共图书馆古籍智慧化阅读的必要性及特征,在文献与应用调研的基础上,以“中华古籍智慧化服务平台”为例,分析平台的系统架构和智慧化阅读模式,为公共图书馆开展古籍智慧化阅读提供实践参考。

[关键词]公共图书馆 古籍 智慧化阅读 人工智能

1 引言

古籍作为中华优秀传统文化的重要载体,承载着丰富的历史、哲学、文学和艺术价值,是中华民族智慧的结晶。然而,由于古籍文本中生僻字较多、缺少标点符号,而且文言文较难理解,古籍在社会大众中的阅读和传播受到了限制。近年来,随着信息技术的飞速发展,特别是人工智能、大数据、自然语言处理等技术的应用,古籍的知识化、智慧化阅读迎来了新的发展机遇,其本质在于通过数字化与智能化,重构古籍知识获取与应用的路径,最终实现“从信息到知识”的跃迁。

国家层面也高度重视古籍的保护和利用,出台了一系列政策支持古籍智慧化工作。2022年,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》,强调要“积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践”[1]。此外,国家还编制实施了《2021—2035年国家古籍工作规划》[2],统筹古籍数字化资源建设与服务,推进古籍专题数据库开发与利用,加速推动古籍智能化利用转型升级。在这些政策的支持下,国家图书馆在文化和旅游部的指导下,联合全国公共图书馆开展了中华古籍智慧化服务平台的建设工作,构建科技赋能、面向大众、开放共享的古籍智慧化阅读平台,推动古籍由“数字化”进一步向“智慧化”转变。本文以中华古籍智慧化服务平台为例,探讨平台的系统架构和智慧化阅读模式,对公共图书馆开展古籍智慧化阅读服务具有重要的参考意义。

2 古籍智慧化阅读概述

2.1 古籍智慧化阅读的必要性

古籍阅读经历了传统的阅览室纸本阅读,到互联网时代的数字阅读,再到人工智能时代的智慧化阅读。传统的纸本文献阅读受限于物理空间和保存条件,读者需要前往图书馆查阅,且因古籍的珍贵性导致其使用受到严格限制,难以满足大众对古籍的阅读需求。互联网时代的数字阅读虽然突破了时空限制,但功能相对单一,主要以图像文本呈现为主,缺乏对古籍知识的深度挖掘和解读,且检索效率较低,难以精准定位信息。人工智能时代的智慧化阅读则实现了古籍的全文OCR识别、自动标点、自动翻译、知识标注等功能,能够快速准确地处理古籍文本,为读者提供智能化检索、辅助阅读、个性化推荐等服务。同时,通过知识图谱构建和AI助手交互,智慧化阅读不仅提升了阅读效率,还增强了读者对古籍知识的理解和应用能力,使古籍阅读更加便捷、高效和富有深度,为古籍的传承与传播开辟了新的路径。

2.2 古籍智慧化阅读的特征

2.2.1 阅读内容的知识化

在智慧化阅读时代,古籍已从单一的数字影像阅读转变为多维度的知识获取。图书馆可以借助于光学字符识别(OCR)技术将古籍图像转换为结构化文本,然后利用人工智能技术,结合人工校对,可从全文文本中获取人物、机构、地名、事件、官职等知识,并对知识进行关联和整合,形成知识网络。例如,浙江大学开发的“智慧古籍平台”[3]通过知识图谱技术,将古籍中的著者、篇目、人物、地名等信息进行关联,提供丰富的知识背景和关联信息。

2.2.2 阅读人群的泛在化

古籍阅读人群泛在化的核心是打破阅读人群的限制,让古籍走向大众。过去,古籍因文言文和晦涩内容,多为学者专属。如今,借助数字化平台和智能工具,古籍被赋予新生命力,从专业人员到普通大众,越来越多的人开始接触古籍。一些平台利用人工智能为古籍加注标点、翻译、注释,甚至提供名家解读,降低了阅读门槛。同时,通过VR和AR技术,古籍内容转化为沉浸式阅读体验,让普通公众仿佛置身古代场景,增强了阅读趣味性和吸引力。

2.2.3 阅读方式的智慧化

在人工智能时代,辅助阅读、交互式阅读、个性化阅读正成为主流。辅助阅读降低了阅读难度,使普通读者能理解古籍内涵。交互式智慧语音听读允许读者通过语音指令查询古籍内容或选择听读模式,AI语音助手朗读古籍并同步显示原文、注释和翻译,方便视力不佳者或在通勤、休闲场景中随时随地享受阅读。个性化阅读则基于读者的阅读历史、兴趣偏好和行为数据,为每位读者量身定制古籍阅读书目,帮助不同需求的读者在海量古籍中精准找到适合自己的内容。

3 我国古籍智慧化阅读的研究与应用现状

3.1 研究现状

笔者以“古籍”、“智慧阅读”为主题词在CNKI上进行检索,2017年以来关于智慧化阅读方面的论文有65篇左右,主要集中在古籍数字化、古籍知识组织与服务、新技术在古籍中的应用等方面。在理论研究方面,熊远明[4]提出智慧图书馆是古籍智慧化服务的重要平台,要通过现代技术手段提升古籍资源的管理和利用效率。茆意宏[5]对智慧阅读进行了定义,强调智慧阅读的“查看”“倾听”“理解”“交谈”和“分析”的能力。张明涓[6]提出“五维协同”模型,强调公共图书馆需从理论、资源、技术、数据、人才五个维度推进古籍智慧化服务。马坤坤[7]提出面向阅读寻求、理解、应用、交流及行为管理“五大情境”,利用AIGC从优质学术资源、阅读认知策略、写作辅导、阅读交流和阅读行为管理5个方面赋能图书馆阅读智慧化服务。在用户研究方面,胡石[8]强调用户在古籍阅读中的行为模式和习惯对古籍智慧化服务的设计和优化具有重要影响。在技术应用方面,韩春磊[9]提出利用人工智能、知识图谱等手段对古籍内容进行深度挖掘和组织,提供智能化的知识服务。张梦笛[10]提出利用大数据技术用于古籍资源的管理和分析。周笑盈[11]结合国家图书馆“VR全景文化典籍”的具体案例,提出了虚拟现实技术赋能古籍智慧化阅读推广的应用路径。王顺箐[12]提出基于用户画像构建智慧阅读推荐系统,从而为解决多样化需求与无差别推荐之间的矛盾提供思路。

笔者在上述研究的基础上,突破单一技术应用与理论构想的局限,将自建的古籍领域大模型应用于古籍的智慧化阅读中,提出以用户需求为中心、以古籍知识化资源为基础、以AI为驱动的古籍阅读模式,为用户提供知识化、智能化、交互性的阅读服务新体验,实现从单一“看古籍”到多维度“用古籍”的生态跃迁。

3.2 应用实践

国内公共图书馆、高校及企业在古籍智慧化阅读应用方面已经开展了相关的应用实践。国家图书馆建设的中华古籍资源库[13]在线提供10.4万余部古籍的访问,是目前国内古籍资源量最多的平台,但仅提供影像资源的检索、阅读。“识典古籍”[14]平台利用OCR技术、自然语言处理技术、AI技术等实现了古籍文本的阅读、文白翻译、AI问答等知识化服务,但平台内古籍资源量较少。籍合网[15]提供大量古籍文本和图像,方便用户检索和研究,但部分资源需要付费。浙江大学智慧古籍平台通过智能文本处理、知识图谱构建和可视化展示等技术,为用户提供高效便捷的古籍研究工具,但该平台的访问速度、资源更新速度和覆盖范围仍有提升空间。

可见上述平台均难兼顾“海量+免费+智能+流畅”的古籍智慧化阅读需求,还有进一步的提升空间。

4 中华古籍智慧化服务平台的智慧化阅读实践

4.1 建设原则

(1)以用户为中心

中华古籍智慧化服务平台的建设始终将用户需求放在首位,平台优化人机交互界面设计,使用自然语言处理和深度学习技术,使用户能够更轻松地获取和理解古籍内容。同时,平台利用AI技术实现个性化推荐,根据用户的阅读历史和偏好,精准推送相关古籍资源,满足不同用户群体的需求。

(2)以资源为基础

中华古籍智慧化服务平台以海量的古籍数字资源为支撑,整合国家图书馆和地方图书馆的数字化古籍资源,实现了全国优秀古籍资源的统一展示。国家图书馆制定了“全国智慧图书馆体系建设:古籍数字化和知识标引规范手册”,地方图书馆以规范手册为标准加工了标准化、统一格式的古籍数据,为平台的资源提供了有力的保障。

(3)以AI为驱动

中华古籍智慧化服务平台通过自建古籍领域大模型实现古籍的文字识别、自动标点、自动翻译、繁简体转换,提升了读者阅读古籍的便利性。此外,平台通过引入第三方大模型DeepSeek与自建大模型相结合的方式,利用大模型的问答能力,为读者提供全天候、快速响应的古籍知识问答服务,读者可通过自然语言与平台进行交互,获取隐藏在古籍全文中的知识。

4.2 系统架构

中华古籍智慧化服务平台的系统架构如图1所示:

图1 中华古籍智慧化服务平台架构图

(1)资源整合层:主要整合全国各级公共图书馆生产加工的古籍数据,各省市图书馆按照“全国智慧图书馆体系建设:古籍数字化和知识标引规范手册”的要求进行古籍的元数据和对象数据的加工,元数据包括基本元数据、目录数据,以XML形式提交,对象数据包括原文影像PDF数据和经过人工校对的文本数据。这些数据经过清洗、查重后统一发布到中华古籍智慧化服务平台内,形成庞大的古籍资源库,为后续的知识化加工和智慧化服务提供数据支持。

(2)技术支撑层:该层主要为知识处理层和读者服务层提供技术支撑,OCR提供文字识别功能,对各省市图书馆提交的古籍影像进行文字识别,保留文字和图像中坐标位置的对应关系,为版式还原和文本图像对照阅读提供位置坐标支撑。自然语言处理(NLP)技术对OCR识别后的文本进行深度处理,包括自动标点、断句、错别字纠正和语义分析等。AI大模型利用图书馆的古籍数据进行了二次训练与任务微调,能更好的适应古籍智能检索、知识处理、知识问答等功能。引入的DeepSeek第三方大模型主要用来处理古籍之外的通用问答服务。知识图谱、大数据分析等技术为古籍知识的可视化展示、语义检索、关联推荐、个性化服务等提供了技术支撑。

(3)知识处理层:该层主要对古籍的文本数据进行深度的知识加工,从古籍文本中抽取知识及知识间的关系,形成古籍的知识网络。主要以AI大模型为技术驱动,人工审核校对为辅助,构建了一套知识处理流程,包括古籍文本自动断句、自动标点、繁简体转换、自动翻译、版式还原等,这为读者阅读古籍提供了便利;通过定义古籍领域的实体模型,自动抽取古籍文本中的人名、官职名、机构名、地名、建筑等实体及实体关系,通过算法对知识实体进行消歧融合,形成古籍知识库。在知识处理过程中,对有异议的知识需要人工进行校对,确保知识的准确性。

(4)读者服务层:该层主要是在古籍全文及知识的基础上,为读者提供智能检索、辅助阅读、智能推荐、基于AI的知识问答、知识可视化、知识关联展示等服务。

4.3智慧化阅读模式

4.3.1 多屏联动全景阅读:构建立体化古籍交互界面

中华古籍智慧化服务平台通过多屏联动全景阅读的方式还原古籍的多维价值,以“原貌呈现—文本解析—导航控制”为逻辑主线,构建三屏协同的立体化交互界面。目录导航屏采用树状层级结构展示古籍目录,可集中展示一种多卷的古籍目录,支持章节跳转。原文影像屏高精度展示古籍原书PDF影像,支持图像放大缩小,便于读者查看古籍图像上的文字细节,如题跋、印章等信息。文本解析屏同步显示OCR识别后的结构化TXT文本,与影像屏实现段落级联动。用户选中文本屏的任意文字,影像屏自动定位至对应位置,便于对照阅读与勘误。文本解析屏还通过版式还原技术,自动识别竖排、双行夹注、朱墨套印等特殊排版,将文字还原成古籍版式,重现古籍视觉特征。

4.3.2 智能解析辅助阅读:攻克古籍语言理解障碍

古籍阅读的最大障碍在于文言文语法、异体字、无标点等语言特征。中华古籍智慧化服务平台以AI大模型为核心,整合自然语言处理(NLP)与机器学习技术,为读者提供智能解析辅助阅读服务。首先,平台支持繁简体通检,读者可从书名、作者、版本等多个维度进行检索,并提供按收藏单位、四部分类、版本类型、装帧形式等条件进行分类导航,助力读者方便找到资源。其次,平台可将古籍中的繁体字转换为简体字,对无断句的古籍文本提供自动断句和标点,将古籍内容翻译成现代汉语,帮助读者跨越语言障碍。在读者阅读过程中,可与古籍AI助手就文章的内容进行交互式提问,解答阅读过程中的疑问。还可以通过全文检索,在本卷或本种古籍全文中检索并定位到全文。再次,平台与中国辞书出版社的聚典数据开放平台进行了对接,读者可划词查询,从汉语大辞典、辞海、近代汉语词典等20多部词典中获取与词语相关的释义、古文出处等,拓宽了知识面。最后,平台提供古籍文本分析服务,以种、册、卷、篇章等为单元,对古籍正文、注疏中的字、实体、图表等进行频次、频率等统计和展示,方便读者了解古籍内容全貌。

4.3.3 知识关联深度阅读:激活古籍知识网络价值

中华古籍智慧化服务平台从海量古籍文本中抽取人物、地名、官职、机构名等关键知识单元,实现了知识的结构化处理。同时,平台还将国家图书馆建设的民国文献、山海经等知识库进行有机整合,构建起一个相互关联的知识仓库。基于知识仓库,平台提供细颗粒度的知识检索功能,读者能够便捷地查看知识的详细信息,包括在古籍中的具体出处及相关知识的展示。同时借助知识图谱技术,直观地呈现知识间关系,如师承关系、学术关系、历史演变关系等,使读者能够深入理解知识的内在联系和历史脉络。

此外,平台聚焦特定主题知识库的建设,如黄河文化专题,从古籍中精选与黄河相关的文献,打造黄河专题知识库。通过地图可视化技术,生动展示黄河河道的历史变迁,深入揭示历代治河人物的故事、治河器具的演变,以及与黄河相关的文献、诗歌和当代纪录片等。这种专题化的知识组织方式,有助于读者更全方位的了解主题知识。

4.3.4 交互协同共创阅读:构建人机共生服务生态

智慧化阅读一大特色是通过技术赋能实现用户与系统的双向互动。中华古籍智慧化服务平台通过自建和接入DeepSeek第三方大模型的方式,构建了基于自然语言交互的AI助手,提供语义检索和提问式检索。为了减轻大模型产生“幻觉”,AI助手使用了检索增强生成技术(RAG),AI助手会对用户提出的问题进行意图判断,如果回答这个问题需要利用字典中的条目或者古籍数据库搜索结果作为上下文,AI助手会获取相关的上下文,通过大模型归纳并给出回复。对于非古籍类或自建大模型回答不出来的问题,AI助手会调用DeepSeek进行回答,提高AI助手回答问题的能力。

中华古籍智慧化服务平台注重满足读者的个性化需求,通过分析读者阅读行为和兴趣偏好,构建用户画像,进而提供“千人千面”的智能推荐;提供了书签、笔记、历史阅读记录等功能,方便读者随时查看和管理自己的阅读历史,增强了阅读的连续性。

中华古籍智慧化服务平台通过建立反馈驱动优化机制,实现了服务的持续改进。一方面平台建立了面向读者的数据勘误机制,读者把疑似错误的数据发送到系统后台,管理员核实后进行更正,借助众多读者的力量不断提高数据的准确性。另一方面,平台建立用户行为分析模型和服务反馈机制,收集和分析用户的高频检索词、使用频率、使用时长、使用时段等多维度数据,根据这些数据定向优化服务。

5总结

笔者以中华古籍智慧化服务平台为例,深入探讨了公共图书馆在古籍智慧化阅读服务中的应用与实践,详细介绍了中华古籍智慧化服务平台的系统架构,提出以AI大模型为核心,构建“多屏联动全景阅读—智能解析辅助阅读—知识关联深度阅读—交互协同共创阅读”的智慧化阅读模式,对公共图书馆开展古籍智慧化阅读服务具有启示和借鉴意义。

首先,公共图书馆需要树立并深化“以用户为中心”的服务理念。这意味着要突破传统的被动服务模式,主动开展用户需求挖掘与分析。具体而言,应建立系统的用户画像体系,针对专家学者、古籍爱好者、普通大众及青少年等不同群体,分别梳理其差异化的知识需求:专家学者侧重研究所需的原始文献与专业工具,爱好者关注文化内涵与阅读辅助,大众则需要通俗易懂的转化内容。通过建立详细的服务台账,定期收集反馈,动态调整服务策略,实现从“资源导向”到“需求导向”的根本转变,使古籍阅读服务更加精准化、个性化。

其次,要充分发挥以大语言模型为代表的人工智能技术的赋能作用。在资源建设方面,应积极应用基于AI的OCR技术,大幅提升古籍影像的文本化效率与准确率,特别是对异体字、避讳字等特殊字符的智能识别。同时,利用知识图谱、自然语言处理等技术,对古籍内容进行深度知识化加工,提取人物、事件、地点、典章制度等知识单元,构建结构化的古籍知识体系。在阅读服务层面,应为读者打造集高清影像、精校数字文本、结构化知识于一体的多维阅读体验。同时为读者提供自动句读标点、智能文白翻译、划词知识查询、人名地名释义等智能辅助阅读服务,有效降低古籍阅读的语言门槛和理解难度,让普通读者也能轻松走进古籍的世界。

最后,要拓宽古籍服务的表现形式与应用场景。一方面,应构建集古籍检索、全文阅读、专题知识服务、智能问答、虚拟体验于一体的综合性服务平台。读者不仅可以通过知识图谱进行可视化探索,发现古籍中隐藏的知识关联,还能与AI助手进行对话交流,获得个性化的解读与推荐。另一方面,要强化人工智能的引领作用,开发创意性的交互应用。例如构建虚拟历史人物对话系统,让用户与古代先贤“直接交流”;开发基于古籍内容的沉浸式情景体验,再现历史场景。通过这些创新形式,将静态的古籍资源转化为动态的文化体验,实现从“阅读古籍”到“活用古籍”的升华。

总之,公共图书馆应当把握人工智能发展的重要机遇,通过理念革新、技术赋能和服务创新三位一体的协同推进,构建更加开放、智能、多元的古籍智慧化阅读服务体系。这不仅能有效提升古籍资源的可利用性和文化影响力,更能让中华优秀传统文化在数字时代焕发新的生机与活力。

参考文献

[1]关于推进新时代古籍工作的意见[EB/OL].[2022-04-11].

https://www.gov.cn/zhengce/2022-04/11/content_5684555.htm.

[2]2021—2035年国家古籍工作规划[EB/OL].[2022-10-11]. https://www.nppa.gov.cn/xxfb/tzgs/202210/P020230108517157708915.pdf.

[3]智慧古籍平台[EB/OL].[2025-02-18].https://csab.zju.edu.cn/.

[4]熊远明.加快智慧图书馆体系建设助力智慧阅读开展[J].新阅读,2024,(09):10-12.

[5]茆意宏,朱玲玲,韩燕.智慧阅读服务概念界定及国内相关研究评析[J].图书情报工作,2020,64(01):131-138.

[6]张明涓.公共图书馆古籍智慧化服务研究[J].数字图书馆论坛,2021,(06):62-67.

[7]马坤坤,朱玲玲,茆意宏.学术平台智慧阅读服务现状剖析与AIGC技术赋能路径[J].图书情报工作,2025,69(02):45-55.

[8]胡石,肖莉杰.新媒体环境下的古籍阅读模式研究[J].图书馆学研究,2012,(19):78-81.

[9]韩春磊,徐卓韵.知识图谱赋能下的历史人物数据平台构建实践——以宋庆龄文献数据中心平台建设为例[J].图书馆杂志,2024,43(06):114-123.

[10]张梦笛.智慧图书馆建设背景下我国古籍数字化战略研究[J].图书馆学刊,2024,46(06):6-10.

[11]周笑盈.虚拟现实技术在古籍智慧化阅读推广中的应用与实践.农业图书情报学报. 2022, 34(08): 79-91.

[12]王顺箐.以用户画像构建智慧阅读推荐系统[J].图书馆学研究,2018,(04):92-96.

[13]中华古籍资源库[EB/OL].[2025-02-18].

http://read.nlc.cn/thematDataSearch/toGujiIndex.

[14]识典古籍[EB/OL].[2024-05-04]. https://www.shidianguji.com.

[15]籍合网[EB/OL].[2024-05-04]. https://www.ancientbooks.cn.

作者简介:魏达贤(1980—),工程硕士,国家图书馆信息技术部高级工程师。研究方向:智慧图书馆建设与服务。

本文刊于《图书馆学刊》2026年第2期,此据作者word版本,引用请据刊物发表版本。

联系我们
电话:010-88544649
传真:010-68476406
扫描关注我们
保护计划
简介
工作机构
政策法规
规划
标准规范
工作简报
相关链接
中华人民共和国文化和旅游部
中国国家图书馆
国家典籍博物馆
中国古籍保护协会
北京大学图书馆
中国社会科学院图书馆
中国科学院文献情报中心
各省保护中心
京ICP备05014420号  电话:(+86 10)88544317  © 国家古籍保护中心版权所有