(一)建设背景
黑龙江图书馆旧址(齐齐哈尔市图书馆“万卷阁”古籍藏书楼所在地)座落于龙沙公园内,1930年竣工并投入使用,占地面积2470平方米,建筑面积1500余平方米,馆内藏有古籍7千余种,12万余册,其中善本近700余种,具有极为重要历史文化价值。2009年“万卷阁”被国务院办公厅授予“全国古籍重点保护单位”,2013年被公布为第七批全国重点文物保护单位。
齐齐哈尔图书馆一直怀着对历史和文化的敬畏承担着保护“万卷阁”藏书的光荣使命和责任。近年来,在国家和地方政府的支持下,“万卷阁”藏书保护环境条件得到了巨大的改善和优化,同时齐齐哈尔图书馆也投入了大量的人力物力到古籍保护工作中,这使得“万卷阁”藏书一直得到了高质量、高标准的保护,并在国家和地方历次图书馆古籍保护工作评价和认证中获得充分肯定。但是在珍贵古籍的保护过程中,因古籍文献极易发生借阅性“损伤”,使古籍无法得到充分利用。在此情况下,如何平衡古籍“保护”与“利用”是当前“万卷阁”古籍保护工作中的重点。
2020年8月10日国家发改委会同有关部门遴选确定的“十四五”时期文化保护传承利用工程项目储备库中涵盖了齐齐哈尔市省图书馆旧址项目。入选项目将得到中央财政资金支持,项目实施不仅可以缓解“万卷阁”古籍保护工作中面临的问题,更将进一步推动完善全国城乡公共文化服务体系,提升文化自然遗产保护水平,推动文化旅游融合和高质量发展。
(二)实施目的
本项目为齐齐哈尔市图书馆的“黑龙江省图书馆旧址古籍数字化建设一期工程”项目,目的在于对齐齐哈尔市图书馆古籍特藏部“万卷阁”所珍藏的近2万余册、120万余页古籍善本进行数字化全文原版扫描,对“万卷阁”所珍藏约100种、1700册重点古籍善本及9种、153册珍贵精品古籍善本进行质量分析与评价,根据古籍善本质量具体情况有针对性采用必要软、硬件设备和技术进行数字化全文原版扫描,对基础成果数据进行有序的组织并使之结构化而形成古籍类数据库,在此基础上建设“万卷阁”古籍保护数据展示及服务平台。让“万卷阁”古籍的价值真正被利用起来。
(一)项目建设内容及实施过程
1. 建设内容
(1)对馆藏古籍原版进行数字化加工,为古籍保存与继承提供有力支撑。在古籍数字化项目实施之初,组织馆内专家对馆藏古籍进行梳理,认真审定优质的馆藏古籍资源,选择善本库和获得国家认定的古籍作为首次数字化的书目,共565种7000余册古籍善本进行数字化全文原版扫描,对约100种珍贵古籍善本采用现代化数字出版技术进行细颗粒度深加工,并按照古籍、文献、报告等类型进行繁简对照、碎片化、数字化加工处理。
(2)打造古籍数据库,兼顾古籍的“藏”与“用”。为了更好的解决“藏”与“用”的矛盾,齐齐哈尔市图书馆将数字化的古籍数据进行了有序的组织并使之结构化,并以此建立“万卷阁古籍藏书平台”,其内容包括:①“万卷阁”古籍保护数据平台。借助现代化知识管理与知识发现技术,为地方古籍数字化保护、研究和利用提供便利,提升古籍整理与保护质效;②“万卷阁”古籍善本藏书平台。集成展示古籍资源、服务、研究报告、“万卷阁发展历史”、“藏书保护工艺发展历程”等内容;③“万卷阁”古籍大数据展示平台。基于古籍资源的数据分析,搭建可视化驾驶舱系统,全方位展示“万卷阁”古籍馆藏情况;④古籍特色专题库。基于“万卷阁”古籍善本数字资源库,为不同应用场景、不同读者提供更完善的专题服务。
(3)建设版权保护管理系统,提升“万卷阁”古籍版权保护质效。为地方古籍数字化保护、研究和利用,基于TPI数字内容传播控制系统(版权保护系统),实现对自加工文档传播范围和对古籍加工资源传播范围的有效控制。
(4)借助融媒体,实现我馆古籍的展示与传播。借助多媒体和新媒体技术建设“万卷阁”古籍保护和研究成果的数字展示空间和线上推广传播多终端服务体系,包含:电脑端、移动端,便于对“万卷阁”古籍文献保护、研究利用与文化挖掘成果进行推广和传播。
2.实施过程
项目实施计划严格遵守项目在实施周期,在28周内完成8个阶段工作。分别是:项目启动阶段、根据需求分析系统设计阶段、系统开发和数字化加工同步实施、系统部署和集成联调阶段、系统测试、试运行、系统培训、验收,完成实施。
根据项目进度安排,平均每日需提交不低于10100页(日产量随着项目实施进度及原始资料类型的变化而波动)。
(1)规划与标准制定
严格遵循国家和国际的相关标准和规范,以确保数字化产品的质量和规范性。在进行古籍数字化建设之前,制定详细的规划和标准。包括确定数字化目标、制定数字化流程、选择合适的数字化技术等。
(2)数字化流程管理
在古籍数字化过程中,建立完善的流程管理体系。包括从古籍原件的登记、扫描、图像处理、数据存储等环节,到数字化平台的制作、审核、发布等流程,都需要制定详细的操作规范和管理制度。
(3)不同古籍的差别化加工
针对其中的部分重点、精品珍贵古籍善本深度挖掘,通过采用现代化数字出版技术进行细颗粒度深加工和深度内容挖掘开发,构建了古籍大数据平台,实现了古籍资源的知识挖掘和文化价值揭示。
(4)人员培训与团队建设
加强对参与古籍数字化建设的人员进行培训,提高他们的专业素养和技术水平。同时,建立一支由图书馆员、专家学者、技术人员等组成的团队,共同推进古籍数字化建设。
(5)知识产权保护
在古籍数字化过程中,重视知识产权的保护。措施防止数字化资源的滥用和盗用,保护古籍资源的合法权益。
(6)持续更新与维护
图书馆不断进行古籍数字化平台的更新和维护,以适应不断变化的市场需求和技术发展。同时,也对数字化产品进行定期的更新和升级,以满足用户的需求和提高服务质量。
(二)项目功能作用及技术应用
1. 项目功能作用
“万卷阁古籍藏书平台”集成展示古籍资源、研究报告,以及以数字地图形式展示“万卷阁发展历史”“藏书保护工艺发展历程”等内容,提供古籍文献知识服务、社交和古籍数字人文研究功能服务等。包含以下模块内容:古籍检索、古籍特点、典藏资源、精品古籍、馆藏记忆、收录概况、数字地图、统计分析、个人中心以及特色专题。系统支持对数字资源的二维、多维导航。
l 古籍检索:本模块便于读者通过一框式检索相关古籍内容。
l 古籍特点:本模块总结体现了齐齐哈尔市图书馆“万卷阁”藏书的四大特点内容。
l 精品古籍:此模块重点展示齐齐哈尔市图书馆9部已入选《国家珍贵古籍名录》的精品古籍内容。
同时也可以通过上方导航“典藏资源”模块进入“精品古籍”模块,点击“更多”进入精品古籍展示页面,可左侧聚类中通过“责任者”、“版本项”、“出版者”“分类”进行古籍分类查找。
可点击相关古籍了解古籍的基本信息、相关人物、事件的知识网络图谱,同时支持原版阅读、文本阅读、添加收藏以及书评撰写等。
点击图谱相关知识内容,可跳转详情页进行知识学习。
古籍原版阅读,即古籍图像浏览翻页、缩放、数据勘误等功能,可进行图文对照阅读、同屏对比阅读。
提供全文知识元的划词连接功能:划词功能涵盖工具书书目范围包括但不限于:《现代汉语分类大词典》、《汉语大词典》、《100年汉语新词新语大辞典》、《古代汉语大词典》、《康熙字典:标点整理本》、《古代汉语通假字大字典》、《金文解析大字典》、《历代避讳字汇典》;书目内容总涵盖不少于12万条的词条。
重点古籍:可进行一框式检索及高级检索,同时支持浏览情况排序以及繁简对照。支持全文阅读以及收藏书评。
l 基础古籍:支持高级检索及一框式检索,根据关键词内容搜索古籍资源。
l 章节典藏
l 图表典藏
l 数字地图:该系统以数字地图以及时间轴的形式,将文献、人物、事件、机构、地点等的位置信息和属性信息呈现在地图上。
点击相关知识元可看到数据之间的关联。
l 收录概况:将古籍数据中的种类、卷册、章节、钤印、人物、机构、事件、地名进行汇总及梳理,同时可通过检索查询相关内容,通过知识元内容进行古籍检索。
l 古籍知识,了解古籍基础知识
l 特色专题:以“万卷阁”古籍资源为基础,结合齐齐哈尔市地方文旅精神研究、红色文化研究及9种精品古籍细分主题相关的公开发表权威学术研究文献,可以实现平台数字资源与学术文献资源的知识关联。
l 馆藏记忆:展示“万卷阁发展历史”“藏书保护工艺发展历程”等内容。
l 统计分析:
对古籍文献进行数据统计分析,搭建可视化驾驶舱系统,全方位展示“万卷阁”古籍馆藏情况。大数据分析读者在本项目各展示平台对于古籍文献资源的检索、浏览、全文阅读时间、借阅等使用情况,生成统计分析图表及报告。
l 个人中心:登录读者在个人中心可建立资料集,并通过检索添加的方式,为资料集添加对应的平台内资源,从而进一步通过数字人文的方式对选定的资源进行挖掘分析。
2. 技术应用
(1)XML知识碎片化技术
采用符合Dita规范的XML数据存储结构,并采用专门的NXD数据库进行存储、管理和查询碎片化的XML数据,将各种古籍资源建设成符合数据库提取标准的全文结构化文件。
(2)知识元抽取技术
知识元抽取技术是面向特色知识服务需求,在资源、产品需求与知识属性规范基础上,根据产品知识框架,定义知识元属性、类型、关系等,基于自然语言处理基础算法,构建知识元抽取模型,实现知识元自动识别、知识元分类、知识元重组等,整合并构建特色知识库,并研发基于知识元粒度和知识库的知识服务技术。实现知识服务模式从文献深入到知识元的知识服务模式转变。
(三)项目运行管理
专人专项分工运维、定期巡检。
系统平台维护:保证操作系统、数据库系统、中间件、其他支撑系统应用的软件系统及网络协议等安全性、可靠性和可用性而实施的维护与管理;及时排除系统故障;每月对系统平台进行一次巡检,及时消除故障隐患,保障系统的安全、稳定、持续运行。
数据储存设施管理和维护:为保证数据存储设施,每月对系统的性能,确认数据存储的安全,及时消除故障隐患,保障系统安全、稳定、持续运行。
数据管理和维护:为保证数据存储、数据访问、数据通信、数据交换的安全,每周对数据的完整性、安全性、可靠性进行检查。
(四)项目建设资金及日常运营维护资金投入
为加强资金管理,提高资金使用效益,确保资金运行安全,有效杜绝专项资金的违规违法和滥用行为,齐齐哈尔市图书馆采取资金使用按预算控制、集体决策、分级审批、财务统一支付的原则进行管理,并专门制定了《黑龙江图书馆旧址专项资金管理办法》,进一步确保了资金的有效落实。依据《财政部关于下达2022年文化保护传承利用工程(第一批)中央基建投资预算(拨款)的通知》(财建〔2022〕57号),并结合黑龙江省发改委《关于转发文化保护传承利用工程2022年第一批中央预算内投资计划的通知》(黑发改投资〔2022〕152号),《黑龙江省齐齐哈尔市省图书馆旧址项目》2021年10月项目获得国家发改委的批准,该项目为中央基建项目,项目总投资2500万元,其中中央预算内资金2000万元,地方配套500万元,建设工期为2022年至2024年,黑龙江省齐齐哈尔市省图书馆旧址项目指标于2022年下达齐齐哈尔市图书馆,该项目资金已划拨到齐齐哈尔市财政,项目主管科处为财政局经建处,其中,500万元计划用于古籍数字化一期工程建设。同时,每年争取相关经费继续加工我馆古籍资源,不断丰富平台内容。
该项目自正式发布以来,平台在访问量、阅读量等方面呈现稳步上升的趋势,用户粘性不断提高,提升了馆藏珍贵古籍的文献利用价值,促进了珍贵古籍的传播利用。
1. 丰富了国内古籍数字化公益服务的资源类型,有效提升了“万卷阁”古籍的学术研究价值和传统文化推广传播价值。
2. 实现了“万卷阁”古籍的创新型保护,通过古籍数字化加工,有效降低纸质古籍的流通量,从而减少了人为损坏,实现古籍整理与保护效率、质量的提升,为古籍在研究、推广、利用等方面提供有力支撑。
本项目创新突破主要体现在五个方面:
(一)创新古籍数字化方式。运用全文碎片化加工技术,实现古籍全文结构化本文加工,打破古籍阅读单一图片模式,实现了古籍图文对照阅读,为读者进行古籍学习研究提供便利。
(二)创新古籍知识呈现方式。运用知识元抽取技术,深度挖掘古籍文本所包含的人物、机构、事件、地理等知识元信息,直观揭示多层次古籍知识网络体系。
(三)创新古籍研读范式。古籍+研究文献+工具书的研读范式,为读者深度研究古籍文献提供了一站式的专业平台,节省了研读时间,提高了阅读效率,提升全民阅读水平。
(四)创新古籍利用新场景。充分利用网络平台的开放性、共享性,搭建古籍数字化应用体验新场景,强化智慧图书馆场景应用。平台的应用加大了古籍的宣传推广力度,实现了多渠道,多媒介,立体化的古籍文化传播。实现了古籍数字资源优化和开放共享。真正让古籍走出万卷阁,走进大众视野。