一、会议情况及背景
7月9-10日,由斯洛文尼亚卢布尔雅那大学亚洲研究系的项目团队与欧洲数字图书馆合作发起的“宝塔”语义研讨会通过视频会议连线的形式举办。来自欧洲数字图书馆的一百多位多位科研工作者及国家图书馆、首都图书馆、沈阳大学的科研代表参加了会议。中国国家图书馆数字资源部季士妍、周笑盈、李一秀3名代表参会,数字资源部周笑盈代表国家图书馆进行了发言,分享国家数字图书馆在文化遗产语义整合方面的实践经验,与会专家们围绕发言内容和各自的工作领域进行了深入的线上讨论。
根据欧盟的资助计划,欧洲数字图书馆“宝塔”项目设立的初衷是以多元的数字化形式展示中国文化遗产。该项目的主要服务范围是丰富欧洲人的文化生活,更广泛的目标是促进欧洲文博机构与中国文化遗产保护组织的国际合作,通过欧洲数字图书馆平台EUROPEANA,以多元的数字化形式展示中国文化遗产,借助语义描述、数字人文技术丰富保存在欧洲的中国文化遗产资源,从而为文化遗产的语义检索、语义关联、信息可视化、知识发现等知识服务提供支持。从“宝塔”项目官方网站获知,目前该项目已收集整理超过1000个文化遗产资源,对2000多个数字对象进行了语义化标引与注释。
二、会议内容
(一)欢迎致辞
卢布尔雅那大学艺术学院院长卢曼·库汉发表欢迎致辞,他认为文化遗产合作一直是中欧文化关系中最具活力的亮点之一,此次中欧专家以云会议形式相聚,希望可以分享彼此在文化遗产语义挖掘领域取得的成果与经验,讨论数字化理念、技术与方法的提升,探索解决文化遗产数字化和语义化过程中出现的问题,以期更好地保护好人类共同的文化遗产。
(二)主旨报告
7月9日,斯洛文尼亚移民研究所、斯洛文尼亚科学与艺术学院研究中心代表发表了主旨报告,题目为“边缘的传承:发现中国移民的遗产”,提出要更多关注在欧洲的中国移民家族留下的文化遗产,伴随着中国经济的崛起,在欧洲的中国移民社会也在不断发展,他们更好地融入了当地社会,对这些移民家族的过去、现在和海外交流故事都有重要的研究价值,例如对家族收藏的传统中国艺术作品、中国城(china town)的研究。
7月10日,玛丽亚·拉里和苏菲·泰斯发表主旨演讲,题目为“从元数据理论到策展实践:播下创新叙事的种子”,提出了混合标引的方法,列举了三种元数据标引形式:自动标引、人工标引、众包标引(图1),自动标引即通过自动的文本识别软件识别人称、地名、机构名(图2),人工标引即通过人工形式映射词表,对自动标引的元数据进行人工清洗和提炼(图3和图4),众包标引即通过网络分发的形式,鼓励民众对图片内容和相关背景进行标引,再由专家对标引信息进行规范,图5是用众包方式对图片元数据进行的标引样例,最后,娜塔莎比对了自动标引、人工标引、众包标引的优缺点,如图6。
图1混合标引形式
图2自动标引
图3词表映射
图4人工规范日期
图5众包形式标引元数据
图6人工标引、自动标引、众包标引对比
(三)主要演讲
欧洲数字图书馆代表乔兰·伍兹介绍了欧洲文化遗产资源的语义本体描述。首先介绍了“宝塔”项目的中国文化收藏专题类型(图7);其次,介绍了对图片资源的本体标引方法,提出了“作品-机构-作家”三级的标引模型(图8);最后是通过对元数据的转化,将其转化为机器可读数据,实现不同图片间的关联(图9),并以一副世界名画的标引为样例,介绍标引过程(图10);最后,提出PAGODE的提案——建立欧洲的本体库,收藏各类本体和词表,以保证本体间的通用性(图11)。
图7“宝塔”的中国收藏专题
图8“作品-机构-作家”标引模型
图9图片间的关联
图10图片的标引样例
图11本体库
卢布尔雅那大学艺术系代表娜塔莎作了题为“中国相关文化遗产整理的语义背景”的演讲,将语义定义分为三个组成部分:人、对象、知识与实践(图12)。
图12语义定义
卢布尔雅那大学专家邓贾·佐曼分享了欧洲的中国文化遗产元数据的标引与关键词目录提取。邓贾·佐曼将关键词分为:地点、历史时代、人物样例、知识实践三类,图13列举出了四类关键词种类下的所属主题,图14和图15展示了在对图片进行主题标引后,根据标引的主题提取关键词。
图13关键词及所属主题词
图14关键词提取
图15关键词提取
埃里克·伯林克斯发表了题为“中国文化遗产的传统元数据,以及如何使其变得更好?”的演讲,提出了关联数据是一种元数据标注的新形式,如图16,在元数据的元数据标引基础上,关联盖蒂中心数据库(图17-图19),可在本数据库中直接调取盖蒂中心的数字化图片,如图20,可实现对藏品超高清数字化图片的放大缩小查看。
图16关联数据标引样例
图17 词表添加
图18 关联数据发布
图19 关联数据展示
图20 关联数据展示
除此之外,荷兰世界文化博物馆代表威廉·范·诺德列举了荷兰对于中国藏品保护的经验与案例;莱顿大学图书馆代表马克·吉尔伯特提出了提升中国藏品可视度与检索性问题。
国家图书馆代表周笑盈从文化遗产的语义标注、语义描述、语义关联和语义知识服务四个角度分享了中国国家图书馆的文化遗产语义化实践经验。
三、参会感想
文化遗产是人类在社会历史发展过程中创造的具有历史、艺术、科学等价值的文化财富,深入研究和挖掘文化遗产,有利于阐发文化精髓,保护与传承文化遗产,推动中外文化交流互鉴。语义技术让一直走在文化遗产数字研究前列的图书馆如虎添翼,本次“宝塔”语义研讨会线上云会议顺利举行,为中国文化遗产整合与挖掘提供了全新的方法、工具和平台,也为欧洲数字图书馆与中国文化遗产保护组织间合作奠定了基础,对进一步促进科技与人文的互动与跨界融合有重要意义。