为深入推进公共文化服务与科技融合发展,提升公共图书馆的服务能力,广东省立中山图书馆(以下简称“广东省馆”)于2019年10月启动“采编图灵”项目建设,针对采编业务自动化进行了深入的探索与研究。历经四年的努力与尝试,先后进行三次重大技术迭代,图书采分编全流程智能作业系统——“采编图灵”于2023年8月正式上线运行,成为目前国内唯一已投入实际业务运作的图书馆采编自动化系统,也成为第一个由国内图书馆引领的全球图书馆行业科技创新。项目建设实现“技术驱动,智慧发展”,为新发展格局下公共图书馆行业探索高质量发展新模式贡献了“广东智慧”。
随着信息技术的快速发展,新兴技术不断成熟并应用于国民经济的各领域,有效带动了生产力发展,推进了生产关系变革。社会各领域均受数字化的影响,图书馆行业也不例外。国内外图书馆界就数字化转型与技术运用进行了广泛的探索,智慧图书馆建设是其中的重要领域,目前已从理论探讨转向应用开发,重点关注通过智慧化技术手段进一步提高管理水平和服务效率,提供更加专业、精准的知识信息服务。从具体应用场景来看,当前国外图书馆关于智慧化、自动化的探索,聚焦于云计算、物联网、工业机器人、人工智能等新技术的应用,主要实践有图书馆管理平台、图书搬运、自动存取扫描、智能参考咨询、面向特殊人群的辅助服务等;国内智慧图书馆建设实践中则应用了大数据、人工智能、物联网、云技术、人脸识别、智能机器人、VR/AR、5G、RIFD、Beacon等技术,并将其投入数据整合与分析、智能参考咨询、设施设备智能管理、读者自助服务、智能书库管理等应用场景。总体来看,国内外智慧图书馆建设的实践探索主要集中在面向读者的前端服务场景,聚焦后端管理领域的实践相对较少,关于图书采编这一基础业务的智慧化创新更为鲜见。
作为图书馆的核心业务流程之一,图书采编业务包括对图书的采购验收、分类编目、典藏加工等,是图书馆服务的开端和基础。一般来说,图书采编流程包含拆包验收、系统收单、馆藏分配等10多道工序,分布在不同工作岗位,图书在每道工序之间的流转都要进行人工搬运。以广东省馆为例,2023年新书采购量约13万种27万册,仅就图书搬运一项来计算,完成27万册图书的所有采编工作至少需要搬运270万册次,任务异常繁重。近年来,采编相关业务外包服务逐渐盛行,有利于缩短文献编目加工周期、提高效率,但由此造成的编目数据质量下降、编目馆员需耗费大量时间进行数据校对和修正等问题较为突出,图书馆仍然面临人员劳动强度高、图书加工周期长、馆员专业水平弱化等困境。因此,伴随着信息技术的发展,如何实现采编业务的自动化作业成为了业界关注与探索的重点。从实践情况来看,虽有各类理念不断提出,但未有成熟模式真正落地实施。
结合外部形势变化以及图书馆行业的业务发展需要,广东省馆聚焦主责主业,立足省域总书库职能,主动思考如何减轻馆员劳动强度和进一步提升采编业务质效,以高水平的图书馆服务能力助力公共文化事业发展。经过全面的发展环境考察、多渠道的调查研究和充分的业务逻辑分析,广东省馆启动“采编图灵”项目建设,旨在实现覆盖图书采编全流程的智能化作业,推动采编业务从劳动密集型向技术密集型转变,填补图书馆文献资源建设领域智慧化应用的空白。
广东省馆从采编业务流程拆分和逻辑归类、技术路线选择和关键问题解决、系统实施预期效能和风险评估等方面综合考虑,设计了“采编图灵”整体流程框架。由于整套系统的创新性和复杂程度相对较高,通过研究相应技术的解决路径,确定了分三期建设的总体思路,既保证阶段性成果输出,又提升实施路径评估和调整的灵活性,切实保障采编业务全流程智慧化建设的总目标。
(一)项目建设内容及实施过程
广东省馆于2019年10月启动“采编图灵”项目,开展了前期调研、总体建设规划等工作。“十四五”时期,为贯彻落实《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》对于图书馆行业发展智慧图书馆的要求,结合文化和旅游部在《“十四五”文化和旅游发展规划》《“十四五”公共文化服务体系建设规划》等提出的推进公共图书馆数字化向智慧化转型发展的方向,广东省馆加快推进项目的实施,并分批次取得了进展:
2021年5月,一期“图书自动化加工系统”原型机上线,实现了图书编目前所有规范化物理加工的自动化作业,包括单册分离、图书识别、馆藏章加盖、条码打印粘贴、RFID粘贴、覆保护膜等。
2023年3月,二期“图书编目无纸化系统”上线,主要实现订单数字化管理、新书自动验收、编目数据自动套录、原编图书无纸化编目、多后台协同管理等功能。
2023年7月,三期“图书典藏加工及馆藏自动分拣系统”上线,主要实现图书编目后加工环节的智能化,到馆新书自动分拣与流通图书分拣复用等功能。
2023年8月,全系统正式上线运行,成功实现“智能化采编作业”的新模式,基本实现项目建设预期目标。随后进入系统功能优化完善阶段,通过实际运行中发现并解决问题,逐步提高系统作业水平。
一期原型机经过近两年的实践积累和技术应用探索,作业水平有所提升,但功能局限性明显。一是无法通过数据准确采集、比对实现“图书批量自动验收”功能,而该功能是自动化处理替代人工核验到货订单的重要需求;二是物理加工环节无法精确定位到图书特定页、特定区域进行馆藏章加盖、条码粘贴等精细化作业。这是源于技术方法和系统架构的局限,不能完全适配二期三期的建设实施,在系统总控、自动化作业装置等方面都亟需进行调整迭代。
2023年12月,一期“图书自动化加工系统”迭代机上线,从系统架构层面重构原有系统,首次开启了多轴工业机器人在图书馆行业的应用实践,全面启动图像处理和图像识别技术,真正实现全数字化智能控制和数据应用,显著提升原型机作业功能的自动化、智能化水平,并实现作业可视化等功能。
(二)项目功能作用及技术运用
1.功能作用
“采编图灵”分为三大子系统,即图书自动化加工系统、图书编目无纸化系统、图书典藏加工及馆藏自动分拣系统,涵盖采编业务全部6个环节、16道工序,实现了业务全流程自动化、数据化和智能化,主要实现了以下几方面的功能:
(1)物理加工
系统配备13台六轴工业机器人、26套定制模组、37台各类型机器人,可仿真模拟人工动作,完成到馆新书从编目前至编目后全流程物理加工作业,包括馆藏条码粘贴、馆藏印章加盖、RFID标签粘贴、隐形藏书标记涂写、封皮/勒口图书涂胶封边、连续自动翻页、图书批量交接、夹取和存放、书标打印和粘贴等。
(2)批量验收
系统可批量比对书商发货清单与图书馆订购清单,确保书商严格按照图书馆需求配送图书,并在新书到馆前完成电子订单预验收。新书到馆后,根据加工过程中采集到的ISBN、定价、种册数等信息,系统可再次比对到馆实物与发货清单,输出验收报表作为购书经费结算依据,并对接图书馆业务管理系统实现批量单册登到,自动完成新书到馆验收全部流程。
(3)编目校对
系统可为预到馆新书批量下载套录全国图书馆联合编目中心的书目数据,并按典藏排架要求,调用《通用汉语著者号码表》自动生成程序,智能生成图书索书号,速度达到1000册/分钟。在套录数据过程中,根据相应的加工规则汇集需要人工干预的书目数据,派发给编目馆员进行人工处理。在加工过程中系统暂存无可套录书目数据的图书,自动拍照扫描图书题名页、版权页、部分内页、封底、封面、书脊等图像信息并整合为PDF文档,分发给编目馆员进行人工无纸化原编作业。
(4)典藏分拣
系统配备15台AGV智能搬运机器人,划分50个分拣格口。在后台统一调度指挥下,机器人可根据RFID标签实时读写的馆藏地及分类号,将完成全部加工流程的到馆新书高效有序地分拣至相应格口,提高新书上架效率。系统还配备了复用分拣功能,通过后端供件台连接分拣平台,可为流通返架图书进行馆藏地及分类号分拣,加快流通图书利用效率。
2.技术运用
“采编图灵”首创性地将人工智能技术、工业自动化技术等集成应用于文献采编领域,截至2024年5月已获得4项发明专利、12项图像处理算法和61项实用新型专利。
(1)深度学习的人工智能图像模型
系统在采编业务流程中首次引入人工智能技术,针对实际应用场景,开发训练图书馆专属算法模型,用于在系统不同模块位置的图书信息的识别和判断,可识别捕获图书三维数据、状态特征、图像信息等;同时对图像进行计算,包括但不限于图书的封底、封面、书脊、题名页、版权页、内页的图像识别和计算,并不断利用采集到的海量数据进行算法模型的迭代,提升识别速度与准确率,实现精准识别。
(2)虚拟目标地址追踪技术
图书种类繁多,尺寸大小不一,颜色五花八门,形态特征各异,但是系统运行必须掌握每本图书的三维尺寸,所以系统首次在采编业务流程中采用数字孪生技术和PID(系统虚拟目标地址追踪码)追踪技术,实现全流程数字化、可视化控制。
(3)边缘网关及高速工业总线技术
系统配置18套机器视觉相机、102套伺服控制系统、345套光电传感器,创新性地采用边缘网关技术和高速工业总线技术,将所有执行机构连通至中央域控制系统,实现统一调度、集中管理、智能作业、实时追踪。
(4)多轴工业机器人技术
系统首次将多轴工业机器人技术和大规模机器人组网及协同作业技术引入图书加工作业流程,完成图书加工、流转过程中复杂、精细的自动化操作;首次在采编业务中应用环形立体仓库技术,搭配重型六轴工业机器人,暂存待编目单本图书,实现高效调度及运转。
(5)分拣系统的复用技术
系统创新性应用AGV自动分拣技术,在相对成熟的流通图书分拣技术基础上,通过业务和软件的创新,采用分拣系统的分时/实时复用技术,在一套分拣系统中集成新书分拣与流通图书分拣,功能更丰富,效率再提升。
(三)项目运行管理
“采编图灵”硬件设备全长约55米,占地约300平方米,累计投入建设资金共1483万元。设备供应商负责按照“采编图灵”项目整体规划和具体业务功能需求定制生产软硬件设备,提供系统调试及功能优化、系统运维等服务。
“采编图灵”还建立起一套从系统自检到人工干预的完整运行监管机制。通过PID号绑定图书信息、追踪图书动向,系统日常运行管理可实现:
1.实时监测图书加工作业情况并呈现在运维中心,馆员监控运行状态;
2.自动甄别加工错误并提交运维中心,馆员通过系统后台终端介入处理;
3.在图书馆业务系统登到单册信息时,根据图书馆业务规范自动校验并修正单册的馆藏地、索书号、复本号等信息;
4.套录数据时,根据图书馆典藏管理要求识别有特殊要求的图书品种,提交给馆员进行人工干预;
5.自动统计图书加工数量、分拣交接情况、图书各类形态占比、不同书商订单占比、订单信息、书目数据套录情况等,直观呈现采编各项业务数据,为动态调整图书采访策略、编目工作进度等提供依据。
从实际运行效果来看,“采编图灵”通过技术应用创新,帮助广东省馆实现采编业务水平的综合提升。
(一)五个创新
1.首创智慧图书馆建设的“广东方案”。“采编图灵”项目是业界首次利用工业自动化、机器视觉、物联网等技术再造图书采分编全流程业务智能化作业,催生了“智能化图书分编”新业态,实现“0”到“1”的突破,受到国内外业界的广泛关注,其业务与新技术应用创新,为业界探索智慧图书馆建设提供了创新思路,具有引领示范作用。
2.首次在图书馆核心业务采编流程中应用人工智能技术。针对实际应用场景,开发训练图书馆专属算法模型,进行深度学习和图像处理。
3.首次在采编流程中采用数字孪生技术。实现全流程的数字化、可视化控制,包括实时图像处理的可视化、后台分配编目任务(包括系统自动套取已有书目数据及人工处理无数据图书)过程的可视化、暂存无数据图书的立体仓库WMS系统的可视化、机器自动化作业运行的可视化。
4.首次将多轴工业机器人技术和大规模机器人组网及协同作业技术引入图书加工作业流程,完成图书加工、流转过程中复杂、精细的自动化操作。首次应用搭配重型六轴工业机器人的环形立体仓库技术,缓存待编目单本图书,实现系统高效调度及运转。
5.创新以“数据流转”替代“图书流转”的采分编业务模式。从数据要素的视角对传统采分编业务模式进行再造和变革,是新技术与图书馆业务深度融合的典型应用。
(二)六个提升
1.提升采编工作效率
“采编图灵”平均每小时可处理约230册图书,到馆单本新书只需在系统中流转一次,最快10分钟即可完成全流程作业。以单独处理一批次2000册的普通图书为例,系统处理加上人工拆包和清点交接环节,完成整批次作业约仅需2个工作日,耗时比传统采编流程的20个工作日(根据2022年第七次全国县级以上公共图书馆评估定级工作对省级公共图书馆的评估标准,指标2.1.2“文献编目时效”要求“图书到馆20个工作日内上架服务”)缩短了90%。在图书加工速度提升的同时,还实现了到馆新书全流程的信息化、智能化和可溯源,采编工作效率大幅提升。
2.提升购书经费的产出效益
“采编图灵”强大的自动化作业能力和效率,基本可以满足过去图书馆招标采购新书时要求书商提供的加工配套服务需求。以广东省馆为例,2024年新书采购项目关于配套服务人员的需求已从2023年的20人缩减到10人,后续随着系统作业水平逐步提升,新书采购所需书商配套服务量有望继续降低。由此,书商加工服务支出减少,图书馆购书经费可以更多地用于采购图书,进一步优化购书经费配置、节约成本,显著提升经费产出效益。
3.提升图书馆员的专业能力培养空间
“采编图灵”实现了到馆新书的自动验收,释放了采访馆员的劳动力,有利于采访馆员专注提升文献资源采选质量。系统将扫描的无书目数据图书图像整合为PDF文档,推送给编目馆员进行无纸化编目,减轻了编目馆员搬运实物的工作强度,有利于编目馆员在技术要求更高的原始编目作业上锤炼专业水平,尤其是加强开展具有馆藏特色的地方文献编目工作。
4.提升读者借阅体验
“采编图灵”提升了图书馆采编工作的效率,加快了新书到馆后上架参与流通的速度,读者能更及时借阅最新图书,借阅服务体验得到提升。同时,系统还可利用采集到的图书图像、部分内页扫描信息,细化知识资源颗粒度,与馆藏书目检索系统关联呈现,提升读者检索体验:一方面可极大地丰富、拓展馆藏书目信息,为读者提供诸如图书预览、目录及文本试读等功能,优化馆藏文献揭示效果;另一方面创新检索路径,实现基于图像或文本内容的逆向检索,让文献索引智慧化应用惠及读者。
5.提升图书馆的数字化服务能力
广东省馆近年年入藏新书约13万种,其中10万种可由“采编图灵”作业加工,且作业流程设定为只对原编图书进行内页采集。目前“采编图灵”每年可采集图书封面、封底、书脊等外观图像30万余拍,题名页、目录、正文等图像34万余拍。这些数据是基于实体文献的编目、图像、文本等的核心数据,具备细颗粒度揭示关联知识的巨大潜质,可开展基于图书内容的知识挖掘和知识关联应用,真正实现智慧化知识服务,将成为未来智慧图书馆建设中重要的数据来源。
6.提升广东省馆在业界的影响力
“采编图灵”是智慧图书馆建设的广东实践,从建设之初就受到各级领导及图书馆业内人士的密切关注,仅2023年就有104批1487人次到现场参观调研,包括多位省部级领导,国家图书馆、上海图书馆、浙江省图书馆等大型公共图书馆,中山大学图书馆、武汉大学图书馆等高校图书馆,以及包括台港澳地区在内的各地图书馆同行。2023年10月,全系统宣传片在网上发布,两个月内视频点击量已超过20000次。系统上线运行后不断扩大的影响力,体现了技术创新性和行业引领性,持续引发业内对于智慧图书馆建设的思考。
同时,系统具有较高的可复制性和推广价值,各图书馆可根据自身需求进行系统模块的增删组合,满足不同规模和类型的业务需求。人工智能算法模型也可以根据实际部署情况灵活调整,无需重新开发,有望助力行业生态转型升级,共同提高工作效益,提升智慧图书馆建设水平。目前业内有深圳市福田区图书馆、宁波诺丁汉大学图书馆等,通过前期充分调研学习“采编图灵”实践案例,结合自身业务发展需求,计划在2024年引进建设图书采编智能作业系统,具体项目已到实施阶段。
综观“采编图灵”项目,从其构思、研究、探索、实施、改进、提升的历程来看,有以下思考与启示:
(一)提高政治站位,深入学习贯彻党中央决策部署,为项目规划指明方向
作为公共文化服务体系的重要组成部分,公共图书馆在“十四五”时期如何切实加强建设,以自身服务水平的提升来贯彻落实好“十四五”规划的各项要求,是公共图书馆提高政治站位、贯彻落实国家战略的责任与担当,也是提升自身发展能力的需要。从图书馆的服务内容看,围绕文献资源建设下功夫无疑是最核心的工作内容之一。结合新的发展形势,广东省馆深入学习贯彻党中央决策部署,选择采编业务自动化的“采编图灵”项目作为公共图书馆在新形势下提升公共文化服务供给能力的重要抓手加以推进。
(二)顺应形势变化,实干先行,确保项目建设走在业界发展前列
伴随着信息技术的发展,如何实现采编业务自动化作业,成为了业界关注与探索的重点,但基本均为理论研究。对此,广东省馆秉承实干先行的改革开放精神,理论研究与实践探索同步推进,在整体投入与风险可控的前提下,积极探索与尝试,在业内首次推出采编业务自动化作业系统。
(三)保持宏观视野,从行业发展的角度思考,为项目发展创造广阔空间
在推进“采编图灵”项目的过程中,广东省馆始终坚持用宏观视野看问题、出方案的工作方式,不囿于自身业务需求,而是从行业发展的角度去思考问题、分析现状、明确思路、提出方案并加以验证。因此,“采编图灵”项目实施后得到众多同业的普遍关注,且具备快速复制推广的基础。
(四)坚持业技融合、以业务为主导,确保项目建设的可用性与实操性
伴随着信息技术的快速发展,各类新技术层出不穷,在推进数字化能力建设、实施数字化转型的过程中面对诸多选项,选择的策略往往决定了其数字化转型之路究竟能够走多远、走多好。从实际执行来看,一味的以新技术为驱动往往不是最优选择,单纯的关注以技术创新带动业务发展可能会带来风险。针对上述情况,广东省馆在推进“采编图灵”项目的过程中,始终坚持“业技深度融合,业务主导定方向、技术协同保执行”的策略,确保所有的决策与选择都是基于对业务需求、读者需要的深度分析后的安排,始终坚持为业务需求选择合适的实施技术,确保业技有效融合的同时,也保证了产出系统的可用性、实用性与易用性。
“采编图灵”项目是图书馆行业在信息化、智能化方面的一次大胆探索,不仅是对传统图书馆业务模式的深刻变革,还体现了当代图书馆人积极拥抱新技术,创新变革更好满足人民美好文化生活需要的态度与实践。未来“采编图灵”发展,除了技术日臻完善外,将切实重视“人”的因素,“以人民为中心”,把先进科学技术和读者、和馆员结合在一起,实现公共文化服务的泛在化和智慧化。